知识图谱系列之Neo4J

  • 2019 年 10 月 6 日
  • 笔记

知识图谱系列之Neo4J

0.作者的话

1.安装Neo4J

2.运行Neo4J

3.Python操作Neo4J

3.1 py2neo安装

3.2 py2neo连接neo4j

3.3 清空数据库结点与边

3.4 py2neo创建结点

3.5 py2neo创建关系

3.6 调用

4.作者的话

0.作者的话

上次写了一篇文章提到了一个有关知识图谱的概念,在本公众号中,并未写有关这方面的文章,那么这一节从python与neo4j方向来共同学习知识图谱的一些实战操作,后续会补充理论方面的知识!

1.安装Neo4J

官网下载Neo4J的zip包,然后解压,将neo4j_path/bin配入path中,进入bin目录运行

neo4j.bat console  pip install py2neo==2.0.8

2.运行Neo4J

浏览器输入:http://localhost:7474,初始用户名与密码均为neo4j

3.Python操作Neo4J

3.1 py2neo安装

pip install py2neo

3.2 py2neo连接neo4j

from py2neo import Graph  def __init__(self):      # 建立连接      link = Graph("http://localhost:7474", username="neo4j", password="***")      self.graph=link

3.3 清空数据库结点与边

def clean_node(self):      # 清空数据库      self.graph.delete_all()

注意:此时会发现Property Keys未删除,要想删除只有找到你的数据库data/graph.db里面全部删除掉才可以。

3.4 py2neo创建结点

创建结点时会发现label需要传参,那么label到底是什么呢? 在neo4j中不存在表的概念,可以把label当作表,相当于在创建多个结点时,指定其为同一label,就类似于为这几个结点(关系型数据库中类似与字段)储存到一张表中。

为了更好的描述疾病、药物等的构建,参考以下ER图进行构建!

from py2neo import Node  def create_node(self):      # 疾病、临床表现、药物等结点定义      for each_dis in dis_list:          dis_node=Node(dis_label,name=each_dis)          self.graph.create(dis_node)        for each_cli in cli_list:          cli_node = Node(cli_label, name=each_cli)          self.graph.create(cli_node)        for each_sdef in drug_list:          drug_node = Node(dru_label, name=each_sdef)          self.graph.create(drug_node)        for each_sdef in sdef_list:          sdef_node=Node(side_effect_label,name=each_sdef)          self.graph.create(sdef_node)        for each_zd in zd_method_list:          zd_node=Node(diagnostic_label,name=each_zd)          self.graph.create(zd_node)

3.5 py2neo创建关系

一个难点:取结点操作

# 取结点,使用find_one()方法,通过指定label,property_key, property_key获取相应的结点  hyp = self.graph.find_one(    label=dis_label,    property_key="name",    property_key="高血压"  )

结点关系方法封装

from py2neo import Relationship  def create_Rel(self):      """      建立关系      高血压疾病与临床表现之间的双向关系定义      :return:      """      # 获取高血压与糖尿病结点,然后通过循环,建立这两个疾病与临床表现的关系      hyp_node = self.graph.find_one(          label=dis_label,          property_key="name",          property_value="高血压"      )      tnb_node = self.graph.find_one(          label=dis_label,          property_key="name",          property_value="糖尿病"      )      # 建立疾病与临床表现的关系      for cli_name in cli_list:          cli_node = self.graph.find_one(              label=cli_label,              property_key="name",              property_value=cli_name          )          hyp_to_cli = Relationship(hyp_node, '产生', cli_node)          self.graph.create(hyp_to_cli)          tnb_to_cli = Relationship(tnb_node, '产生', cli_node)          self.graph.create(tnb_to_cli)      # 建立疾病与诊断方法之间的关系      for diag_name in zd_method_list:          diag_node = self.graph.find_one(              label=diagnostic_label,              property_key="name",              property_value=diag_name          )          if diag_name=="血糖" and diag_name=="血脂" and diag_name=="胆固醇":              diag_to_dis = Relationship(diag_node, '辅助检查', tnb_node)          else:              diag_to_dis = Relationship(diag_node, '辅助检查', hyp_node)          self.graph.create(diag_to_dis)      # 建立疾病与药物关系      for drug_name in drug_list:          drug_node = self.graph.find_one(              label=dru_label,              property_key="name",              property_value=drug_name          )          if drug_name=="胰岛素" or drug_name=="胰高血糖素":              drug_to_disease=Relationship(drug_node,'治疗',tnb_node)          else:              drug_to_disease= Relationship(drug_node, '治疗', hyp_node)          self.graph.create(drug_to_disease)        # 建立药物与副作用之间的关系      for drug_name in drug_list:          drug_node = self.graph.find_one(              label=dru_label,              property_key="name",              property_value=drug_name          )          for sdef_name in sdef_list:              sdef_node = self.graph.find_one(                  label=side_effect_label,                  property_key="name",                  property_value=sdef_name              )                if drug_name == "利尿药" and sdef_name == "尿酸升高":                  drug_to_sdef = Relationship(drug_node, '引发', sdef_node)                  self.graph.create(drug_to_sdef)              elif drug_name == "钙拮抗药" and sdef_name == "血钾降低":                  drug_to_sdef = Relationship(drug_node, '引发', sdef_node)                  self.graph.create(drug_to_sdef)              elif drug_name == "胰岛素" and (sdef_name == "恶心" or sdef_name == "呕吐"):                  drug_to_sdef = Relationship(drug_node, '引发', sdef_node)                  self.graph.create(drug_to_sdef)              elif drug_name == "胰高血糖素" and (sdef_name == "头晕" or sdef_name == "眼花"):                  drug_to_sdef = Relationship(drug_node, '引发', sdef_node)                  self.graph.create(drug_to_sdef)

3.6 调用

上述代码全部封装在createBHPData类中,需要实例化对象,然后调用相应方法。

c=createBHPData()  c.clean_node()  c.create_node()  c.create_Rel()

最后,刷新浏览器版neo4j,然后就可以看到自己的图了。

4.作者的话

最后,您如果觉得本公众号对您有帮助,欢迎您多多支持,转发,谢谢! 更多内容,请关注本公众号知识图谱系列!