|
小象学院《知识图谱》视频教程
课程大纲:
第一课: 知识图谱概论
1. 知识图谱的起源和历史
2. 典型知识库项目简介
3. 知识图谱应用简介
4. 本次课程覆盖的主要范围:知识表示与建模、知识抽取与挖掘、知识存储、知识融合、知识推理、语义搜索、知识问答和行业知识图谱应用剖析等内容。
第二课: 知识表示与知识建模
1. 早期知识表示简介
2. 基于语义网的知识表示框架
a. RDF和RDFS
b. OWL和OWL2 Fragments
c. SPARQL查询语言
d. Json-LD、RDFa、HTML5 MicroData等新型知识表示
3. 典型知识库项目的知识表示
4. 基于本体工具(Protege)的知识建模最佳实践:
第三课: 知识抽取与挖掘I
1. 知识抽取任务定义和相关比赛:实体识别、关系抽取和事件抽取
2. 面向结构化数据(关系数据库)的知识抽取,包括D2RQ和R2RML等转换与映射规范与技术介绍( V6 Q$ U0 [! E6 O' m% }4 o
3. 面向半结构化数据(Web tables, 百科站点等)的知识抽取5 X5 O& N: v& `9 E$ C
a. 基于正则表达式的方法" n; b W5 p# h3 ~) h! K/ p
b. Bootstrapping和Wrapper Induction介绍* Z! \& f$ m v: q
4. 实践展示:基于百科数据的知识抽取
& u' k7 c% i7 [& K5 O! {
第四课: 知识抽取与挖掘II3 l% u# T) F& E. R
) J H H) d( E$ R. K7 m$ V
1. 面向非结构化数据(文本)的知识抽取$ A5 }! N( t9 j( j7 V+ U
a. 基于本体的知识抽取,包括NELL和DeepDive系统介绍
b. 开放知识抽取,包括TextRunner、Reverb和OLLIE等系统介绍$ _/ L2 J! @2 G- N4 r) _) Q
2. 知识挖掘/ Q5 O3 h# \' a3 ^& t6 {! k3 O% q
a. 知识内容挖掘:实体消歧与链接# T/ W) I8 i3 T9 ]
b. 知识结构挖掘:关联规则挖掘与社区发现
c. 知识表示学习与链接预测,包括TransE和PRA等算法介绍 i7 H, n4 z, {
第五课: 知识存储2 Z7 i' T. q7 u7 H/ `
1. 基于关系数据库的存储设计,包括各种表设计和索引建立策略& Q9 `1 U- M7 z/ H, G
2. 基于RDF的图数据库介绍- T# p0 ^9 [4 J6 X o" ~: h
a. 开源数据库介绍:Apache Jena、Sesame、gStore、RDF-3X等
b. 商业数据库介绍:Virtuoso、AllegroGraph、BlazeGraph等
3. 原生图数据库介绍,包括Neo4j、OrientDB、Titan和Cayley等( f& j2 R/ N' ~" K/ P
4. 实践展示:使用Apache Jena存储百科知识,并使用Fuseki构建图谱查询服务
第六课: 知识融合3 a" a" A& n3 M; u" d
1. 知识融合任务定义和相关竞赛:本体对齐和实体匹配, y+ t3 c' Y: ~% [/ D) N- ~
2. 本体对齐基本流程和常用方法
a. 基于Linguistic的匹配
b. 基于图结构的匹配
c. 基于外部知识库的匹配' H* U7 h& E9 F' p1 G6 z' M2 V8 N
3. 实体匹配基本流程和常用方法2 X( \7 R! |' F4 E+ R6 A. i9 d
a. 基于分块的多阶段匹配
b. 基于规则(配置或通过学习)的实体匹配
4. 知识融合工具介绍:包括Falcon-AO、Silk、PARIS、DEDUPE、LIMES和KnowledgeVault
5. 实践展示:使用Falcon-AO融合百度百科与维基百科中的知识
/ X) Y9 J: H" P* E9 R/ | @
第七课: 知识推理8 |6 Z* R. Z7 I- C) z- [
1. 本体知识推理简介与任务分类,包括概念可满足性、概念包含、实例分类和一致性检测等; i+ h0 ^! J, J& W! U
2. 本体推理方法与工具介绍* T3 L# ~+ ?5 Y
a. 基于Tableaux运算的方法:Fact++、Racer、Pellet和Hermit等8 f" N( u) l' i8 W* g
b. 基于一阶查询重写的方法:Ontology-based Data Access的Ontop等
c. 基于产生式规则的方法(如Rete):Jena、Sesame和OWLIM等
d. 基于逻辑编程(如Datalog)改写的方法:KAON2和RDFox等
3. 实践展示:使用Jena完成百科知识上的上下位推理、缺失类别补全和一致性检测等8 I" Z! h- V3 H% S
第八课: 语义搜索
7 U( v4 p- k: E7 L* g
1. 语义搜索概述,包括Knowledge Card、Rich Snippet、Facebook Graph Search等
2. 基于语义标注的网页搜索- u' r7 y. z, B3 l0 Y* m; {
a. Web Data Commons项目介绍
b. 排序算法介绍,扩展BM25
3. 基于图谱的知识搜索
a. 本体搜索(ontology lookup)
b. 探索式知识检索,包括查询构造、结果排序和分面(facets)推荐
4. 知识可视化,包括本体、查询、结果等的展现方式和可视化分析
5. 实践展示:使用ElasticSearch实现百科数据的语义搜索
第九课: 知识问答I
1. 知识问答概述和相关数据集(QALD和WebQuestions)
2. 知识问答基本流程
3. 知识问答主流方法介绍
a. 基于模板的方法,包括模板定义、模板生成和模板匹配等步骤
b. 基于语义解析的方法,包括资源映射,逻辑表达式候选生成与排序等
c. 基于深度学习的方法
第十课: 知识问答II
1. IBM Watson问答系统及核心组件详细解读
a. 问句理解
b. 候选答案生成
c. 基于证据的答案排序
2. 实践展示:面向百科知识的问答baseline实现
第十一课: 行业知识图谱应用
1. 行业知识图谱特点
2. 行业知识图谱应用,包括金融、医疗、数字图书馆等领域应用
3. 行业知识图谱构建与应用的挑战
4. 行业知识图谱生命周期定义和关键组件
下载地址回复可见:
|
|