当前位置:   article > 正文

Neo4j使用心得_neo4j set 存入特殊字符

neo4j set 存入特殊字符

1、软件环境

Neo4j桌面端管理软件版本:1.2.4
安装的数据库版本是Neo4j3.5.17

2、数据库的交换

在项目中创建出数据库名称及数据库版本,会生成对应的数据库文件databases,可以通过粗暴地替换该数据库文件实现数据库的交换。(一台机器一般只能同时运行一个数据库)
在这里插入图片描述
在这里插入图片描述

3、本体文件转换成Neo4j文件

3.1、安装与导入

OWL文件导入Neo4j 4.1.3:
https://blog.csdn.net/wsj_518/article/details/110236557
官方教程(很清楚):
https://neo4j.com/labs/neosemantics/4.0/import/
  • 1
  • 2
  • 3
  • 4

这个博客写的很详细,注意:
1、安装neosemantics (n10s)时,要注意与Neo4j图数据库版本保持一致,可以直接在Neo4j客户端进行插件安装。
https://github.com/neo4j-labs/neosemantics/tree/4.3
在这里插入图片描述

2、导入命令中的本地文件地址字符串形式,例如
初始化配置

CREATE CONSTRAINT n10s_unique_uri ON (r:Resource) ASSERT r.uri IS UNIQUE
call n10s.graphconfig.init()
  • 1
  • 2
call n10s.rdf.import.fetch( "file:///D:/pythonproject/RDB2OWL/data/newOWL.ttl","Turtle")
也可以是其他格式,例如官方教程给出的Turtle, N-Triples, JSON-LD, RDF/XML, TriG and N-Quads
call n10s.rdf.import.fetch( "file:///D:/pythonproject/RDB2OWL/data/newOWL.rdf","RDF/XML")
  • 1
  • 2
  • 3

本体文件的格式,可以直接使用protege进行另存。

在这里插入图片描述
在这里插入图片描述

3.2、导入到Neo4j的效果分析

使用n10s将本体文件导入到Neo4j时,会将本体文件中自带概念、属性一并导入进来,在本体中自定义的类、数据属性和关系属性等都被添加了ns0前缀,但是数据属性的值没有被加前缀,
在这里插入图片描述

3.2、导入后的n10s的前缀处理

将中文开放知识图谱的owl文件导入到neo4j中,踩坑总结
https://blog.csdn.net/qq_43071444/article/details/121200748
OWL/RDF导入neo4j前缀消除,踩坑总结
https://blog.csdn.net/yaminne/article/details/118768139
采用的是match(n) where n.uri=~"http://www.kgtest.com#.*" set n.uri=substring(n.uri,22) return n CQL语句。

去除节点的uri属性值的http前缀
match(n) where n.uri=~"http://www.semanticweb.org/kert/ontologies/2022/6/BMMOntology#.*" set n.uri=substring(n.uri,62)    return n 
typesToLabels: false,//生成实例与类相连,无类别 ,经过n10s 4.3.0.0版本的测试,没有实现 生成实例与类相连
call n10s.rdf.import.fetch( "file:///D:/pythonproject/RDB2OWL/data/importNeo4j/BMMOntology_reasoning.owl","RDF/XML",{typesToLabels:false})
  • 1
  • 2
  • 3
  • 4

此处还提供一份python代码用于批量去除图数据库中的标签标签、关系、属性字段中的ns0__前缀

# -*- coding: utf-8 -*-
# @Time : 2022-09-01 19:46
# @Author : 山南君
# @Function : 使用python和原生Cypher语句操作Neo4j图数据,主要是为了修改 本体经n10s转存到Neo4j的图数据库标签、关系、属性字段中的ns0__前缀。使用的是官方的neo4j-driver 4.4.6
# @History :
# @Software: PyCharm
from neo4j import GraphDatabase

class CQLHelper:
    def __init__(self):
        self.uri = "neo4j://localhost:7687"
        self.driver = GraphDatabase.driver(self.uri, auth=("neo4j", "123456"))

    def RunCQLstrs(self,CQLstrPath):
        '''
        从txt文件中按行读取多条CQL命令进行循环执行
        Args:
            CQLstrPath: CQL命令所在txt文件路径
        Returns:
        '''
        CQLstrs = [i.strip() for i in open(CQLstrPath, encoding='utf-8') if i.strip()]
        for cql in CQLstrs:
            if len(cql)!=0:
                with self.driver.session() as session:
                    res = session.run(cql)
                    print(res.data())

    def updateRelation(self):
        cql1="MATCH ()-[r]->() RETURN r "
        relations=[]
        with self.driver.session() as session:
            res = session.run(cql1)
            for dt in res.data():
                relation=dt['r'][1]
                if relation not in relations:
                    relations.append(relation) #将所有的关系放在一个list中

        #将关系名中的ns0__前缀删除
        for relation in relations:
            newRelation=str.replace(relation,"ns0__","")
            cql2 = "match(n)-[r:{0}]->(m) create(n)-[r2:{1}]->(m) set r2=r with r delete r".format(relation,newRelation)
            with self.driver.session() as session:
                res = session.run(cql2)
                print(res.data())

    def updateLabelAndProperty(self):
        cql1="Match (n) return  labels(n) AS label"
        labels=[]
        with self.driver.session() as session:
            res = session.run(cql1)
            for li in res.data():
                label=li['label']
                labels=labels+label

        labels=list(set(labels)) #对标签进行去重
        print(labels)
        #修改标签名,去除标签名中的ns0__ 前缀
        for lab in labels:
            if "ns0__" in lab:
                newlab = str.replace(lab, "ns0__", "")
                cqlstr=''' MATCH (n:`{0}`)  REMOVE n:`{0}`  SET n:`{1}`   '''.format(lab,newlab)
                with self.driver.session() as session:
                    res = session.run(cqlstr)
                print("标签:", lab,  "新标签:", newlab)
        print("图数据库中的所有标签集合:",labels)
        print("所有标签已经修改完成,或者没有要修改的标签")

        #按标签类型获取每个标签类型的字段属性集合
        for lab in labels:
            props = []
            cql2 = r"MATCH (n:`{0}`) WITH n  UNWIND keys(n) as key RETURN distinct key".format(lab)
            with self.driver.session() as session:
                res = session.run(cql2)
                for i in res.data():
                    if i not in props:
                        props.append(i['key'])
            print("标签:", lab, "对应的属性集合:", props)

            #按标签名依次去除该标签名的属性名中的 ns0__ 前缀
            for key in props:
                if "ns0__" in key:
                    newKey=str.replace(key,"ns0__","")
                    cql3 = "match(n:`{0}`) set n.`{1}`=n.`{2}` remove n.`{2}`".format(lab,newKey,key)
                    with self.driver.session() as session:
                        res = session.run(cql3)
                    print("标签:", lab, "属性:", key,"新属性:",newKey)
        print("所有标签的所有属性已经修改完成,或者没有要修改的属性")

if __name__ == '__main__':
    helper=CQLHelper()
    path="CQLStrings.txt"
    helper.updateLabelAndProperty()

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • 39
  • 40
  • 41
  • 42
  • 43
  • 44
  • 45
  • 46
  • 47
  • 48
  • 49
  • 50
  • 51
  • 52
  • 53
  • 54
  • 55
  • 56
  • 57
  • 58
  • 59
  • 60
  • 61
  • 62
  • 63
  • 64
  • 65
  • 66
  • 67
  • 68
  • 69
  • 70
  • 71
  • 72
  • 73
  • 74
  • 75
  • 76
  • 77
  • 78
  • 79
  • 80
  • 81
  • 82
  • 83
  • 84
  • 85
  • 86
  • 87
  • 88
  • 89
  • 90
  • 91
  • 92
  • 93

9、其他拓展资料

1、如何在一台机器上同时运行多个图数据库
https://blog.csdn.net/ljp1919/article/details/103170995
2、neo4j属性无法写入的字符
https://blog.csdn.net/for_yayun/article/details/121148849
由于Neo4j不支持特殊字符,如 - []等,但是支持下划线和小数点_ .,所以使用n10s时导入本体时,就要求本体中不可以包含一些特殊字符。如果本体中包括特殊字符,n10s就会报错。
在这里插入图片描述

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/从前慢现在也慢/article/detail/641450
推荐阅读
相关标签
  

闽ICP备14008679号