深入了解Excel模板文件解析原理

NRD Studio导入Excel模板文件自动生成关系图谱,应用十分广泛。

介绍下解析原理。

图谱的节点数据以首列为准,首行则是副本,行列交叉的单元格代表关系。

目前Excel文件中两个节点间能添加两条关系,比如N1 -> N2和N2 -> N1是独立的关系。节点不能指向自身,即便填写了也会被忽略。

解析基础流程:

  1. 分别按首行和首列遍历,去除空行和空列(属性列除外),转化为新数据结构
  2. 组装节点属性
  3. 组装关系及其属性

行列严格对照,正方形排布,以首列为基准,行依据实际情况去除冗余部分。

完全按照节点索引(等同id)来查询对照,不再依赖节点名称,相当于自动校正行节点数据。