
人工智能知識圖譜從基礎理論到項目案例實戰課程視頻教程下載。本課程從實戰出發,圍繞知識表示、知識抽取、語義搜索、知識問答、知識推理、知識融合等系統性介紹知識圖譜相關的實戰技術,使得學員具備研發知識圖譜相關應用的基礎能力。結合醫療、金融、電商等實際應用場景,介紹知識圖譜各個技術點的實際應用落地方式,使得學員具備結合自身背景開展知識圖譜技術實踐的應用能力。
課程大綱:
第一課:知識圖譜概論
1、知識圖譜的起源和曆史
2、典型知識庫項目簡介
3、知識圖譜應用簡介
4、本次課程覆蓋的主要範圍:知識表示與建模、知識抽取與挖掘、知識存儲、知識融合、知識推理、語義搜索、知識問答和行業知識圖譜應用剖析等内容。
第二課:知識表示與知識建模
1、早期知識表示簡介
2、基于語義網的知識表示框架
a、RDF和RDFS
b、OWL和OWL2 Fragments
c、SPARQL查詢語言
d、Json-LD、RDFa、HTML5 MicroData等新型知識表示
3、典型知識庫項目的知識表示
4、基于本體工具(Protege)的知識建模最佳實踐
第三課:知識抽取與挖掘I
1、知識抽取任務定義和相關比賽:實體識别、關系抽取和事件抽取
2、面向結構化數據(關系數據庫)的知識抽取,包括D2RQ和R2RML等轉換與映射規範與技術介紹
3、面向半結構化數據(Web tables, 百科站點等)的知識抽取
a、基于正則表達式的方法
b、Bootstrapping和Wrapper Induction介紹
4、實踐展示:基于百科數據的知識抽取
第四課:知識抽取與挖掘II
1、面向非結構化數據(文本)的知識抽取
a、基于本體的知識抽取,包括NELL和DeepDive系統介紹
b、開放知識抽取,包括TextRunner、Reverb和OLLIE等系統介紹
2、知識挖掘
a、知識内容挖掘:實體消歧與鏈接
b、知識結構挖掘:關聯規則挖掘與社區發現
c、知識表示學習與鏈接預測,包括TransE和PRA等算法介紹
第五課:知識存儲
1、基于關系數據庫的存儲設計,包括各種表設計和索引建立策略
2、基于RDF的圖數據庫介紹
a、開源數據庫介紹:Apache Jena、Sesame、gStore、RDF-3X等
b、商業數據庫介紹:Virtuoso、AllegroGraph、BlazeGraph等
3、原生圖數據庫介紹,包括Neo4j、OrientDB、Titan和Cayley等
4、實踐展示:使用Apache Jena存儲百科知識,并使用Fuseki構建圖譜查詢服務
第六課:知識融合
1、知識融合任務定義和相關競賽:本體對齊和實體匹配
2、本體對齊基本流程和常用方法
a、基于Linguistic的匹配
b、基于圖結構的匹配
c、基于外部知識庫的匹配
3、實體匹配基本流程和常用方法
a、基于分塊的多階段匹配
b、基于規則(配置或通過學習)的實體匹配
4、知識融合工具介紹:包括Falcon-AO、Silk、PARIS、DEDUPE、LIMES和KnowledgeVault
5、實踐展示:使用Falcon-AO融合百度百科與維基百科中的知識
第七課:知識推理
1、本體知識推理簡介與任務分類,包括概念可滿足性、概念包含、實例分類和一緻性檢測等
2、本體推理方法與工具介紹
a、基于Tableaux運算的方法:Fact++、Racer、Pellet和Hermit等
b、基于一階查詢重寫的方法:Ontology-based Data Access的Ontop等
c、基于産生式規則的方法(如Rete):Jena、Sesame和OWLIM等
d、基于邏輯編程(如Datalog)改寫的方法:KAON2和RDFox等
3、實踐展示:使用Jena完成百科知識上的上下位推理、缺失類别補全和一緻性檢測等
第八課:語義搜索
1、語義搜索概述,包括Knowledge Card、Rich Snippet、Facebook Graph Search等
2、基于語義标注的網頁搜索
a、Web Data Commons項目介紹
b、排序算法介紹,擴展BM25
3、基于圖譜的知識搜索
a、本體搜索(ontology lookup)
b、探索式知識檢索,包括查詢構造、結果排序和分面(facets)推薦
4、知識可視化,包括本體、查詢、結果等的展現方式和可視化分析
5、實踐展示:使用ElasticSearch實現百科數據的語義搜索
第九課:知識問答I
1、知識問答概述和相關數據集(QALD和WebQuestions)
2、知識問答基本流程
3、知識問答主流方法介紹
a、基于模闆的方法,包括模闆定義、模闆生成和模闆匹配等步驟
b、基于語義解析的方法,包括資源映射,邏輯表達式候選生成與排序等
c、基于深度學習的方法
第十課:知識問答II
1、IBM Watson問答系統及核心組件詳細解讀
a、問句理解
b、候選答案生成
c、基于證據的答案排序
2、實踐展示:面向百科知識的問答baseline實現
第十一課:行業知識圖譜應用
1、行業知識圖譜特點
2、行業知識圖譜應用,包括金融、醫療、數字圖書館等領域應用
3、行業知識圖譜構建與應用的挑戰
4、行業知識圖譜生命周期定義和關鍵組件
主講老師:
著名知識圖譜專家
博士畢業于上海交通大學,CCF術語專委會執委,中文信息學會語言與知識計算委員會副秘書長,共發表75餘篇高水平論文。中文知識圖譜zhishi.me創始人,OpenKG聯盟發起人之一,其帶隊構建的語義搜索系統在Billion Triple Challenge中榮獲全球第2名;在著名的本體匹配競賽OAEI的實體匹配任務中斬獲得全球第1名。曾主持并參與多項國家自然科學基金、863重大專項和國家科技支撐項目,以學術負責人身份參與Paypal、Google、Intel、IBM、百度等企業的合作項目。
課程簡介:
本次的知識圖譜課程主要包括三大部分:
1、知識圖譜的工程方法論。指導學員了解并掌握知識圖譜的基本概念和發展曆史,梳理清知識圖譜的技術體系,掌握知識圖譜的核心技術原理,建立知識圖譜工程的方法論思維。
2、知識圖譜的實戰技術。從實戰出發,圍繞知識表示、知識抽取、語義搜索、知識問答、知識推理、知識融合等系統性介紹知識圖譜相關的實戰技術,使得學員具備研發知識圖譜相關應用的基礎能力。
3、知識圖譜的典型應用。結合醫療、金融、電商等實際應用場景,介紹知識圖譜各個技術點的實際應用落地方式,使得學員具備結合自身背景開展知識圖譜技術實踐的應用能力。
面向人群:
1、希望學習知識圖譜的學生;
2、希望了解知識圖譜實戰技術的IT從業人員;
3、未來希望成爲知識圖譜工程師的求職者;
4、想在知識圖譜方向進行深入研究者。
學習收益:
通過本課程的學習,學員将會收獲:
1、幫助學員系統性的掌握知識圖譜的核心技術原理,結合近期研究成果,學習從基本概念到各個先進算法和技術的轉化思路
2、了解國内外典型的開源知識庫數據及技術資源
3、實踐與理論結合,培養學員面對工程及學術問題的思考解決能力
4、基于百科知識進行各項核心技術的實例訓練,并結合醫療、金融、電商等行業應用幫助學員快速積累知識圖譜工程項目經驗
5、對有志于從事知識問答工作或學術研究的學員,提供IBM Watson系統實現原理的講解與指導