构建课程知识图谱的完整流程推荐

构建课程知识图谱是一项工作量较大的工程,涉及的知识领域非常广泛,并且需要不少的技术积累。

好在发展至今日,市面上已经有诸多高效工具,帮助我们大大减轻负担。

科研合作知识图谱示例

在线示例预览地址:https://nrdstudio.cn/app/f259aaa813d71c42d1c3bb6cefc58328/

通常构建课程知识图谱主要有六个步骤:

1.获取基础数据

数据源是准备工作,没有固定的模式,具体形式与实际课题有关。一般是爬取网上公开内容(注意版权),或者手工整理数据。

2.知识抽取nlp

nlp全程是自然语言处理( Natural Language Processing, NLP),算是人工智能AI的方向之一。

常用的方法是用编写程序,从成堆的数据中提取有效的片段内容。

编程语言首选Python,相关处理库比较多。

3.图数据库数据模型

知识抽取后,需要一些媒介存储,流行用图数据库,目下头部产品是Neo4j。

按照图数据库的规范,整理数据模型,把所有数据编入数据库中。

当然,入库并不是必需的。如果数据量不大或易管理,比如已经用Excel系统性整理好数据,那么这些文档本身也可以作为数据源。

4.数据可视化

数据可视化目的是换个维度来展示数据,图形化更容易理解。

可视化工具非常多,这里推荐一个有编辑器的在线工具:NRD Studio

5.分析交互

知识图谱包含的数据较多,可视化工具具有基础的交互功能,如查询、筛选、拖拽等。

6.数据报告

数据处理完毕后,应该出具报告,形式不一,方便自己或他人研究,充分发挥和挖掘数据价值,为未来下一步注入新能源,事半功倍。