赞
踩
之前写过用neo4j-import 的一个博客,本以为我的neo4j奇幻之旅就要结束了,然鹅,领导说咱们每天还有100w的数据需要跑进去。
neo4j-import肯定不能再用了,因为每次都要清空数据库,第一次投产生成的csv文件有10多个G,把这些数据文件传输到neo4j的服务器上很占资源,如果每天重跑一次,显然不太现实。
batch-neo4j我也研究了一下,只需要下载一个jar包,执行就可以了,不过好像这种只适合新增的数据,而我们的100w数据中还有修改的,即 如果节点已存在则修改,不存在则新增。
load csv 上边最快的两种方式都不能满足我的要求,我也很无奈,只得退而求其次,选择了不是很快的load csv,不过他的好处就是不用关闭neo4j的服务也可导入,导入方式也简单
使用load csv非常简单,直接将之前生成csv文件的脚本拿来就可以,在查询语句加上 where updateDate=sysdate
生成了三个csv文件pernode.csv comnode.csv rel.csv放到neo4j/import目录下,因为conf配置load csv默认目录是这里。
<
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。