赞
踩
分享一个有点儿意思的开源项目~
最近想训练一个符合某人说话风格的 AI,微信的聊天记录里就有着丰富的训练数据。
聊天记录是珍贵的记忆,也是每一场对话、每一个互动的真情流露。
想要拿到这些数据,无论是保存备份还是用于 AI 训练,手动拷贝都不现实。逛 Github 发现了这个不错的项目:留痕。
这是一名西北工业大学的学生开源的一个项目,作者这样说道:
使用方法非常简单:将手机的聊天记录迁移到电脑,然后使用WeChatMsg
解密。
安卓:手机微信->我->设置->聊天->聊天记录迁移与备份->迁移-> 迁移到电脑微信;
iOS:手机微信->我->设置->通用->聊天记录迁移与备份->迁移-> 迁移到电脑微信。
迁移完成后重启微信,迁移前也最好提前备份一下聊天数据。
然后 clone 项目并安装依赖:
- # Python>=3.10 仅支持3.10、3.11、3.12,请勿使用其他Python版本
- git clone https://github.com/LC044/WeChatMsg
- cd WeChatMsg
- pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
直接运行 main.py 即可解析数据。
python main.py
效果演示
解析好的数据,可以做清洗,用于 AI 模型训练,也可以用于个人的数据分析。
项目地址:
https://github.com/LC044/WeChatMsg
最后,鱼皮还是要提醒大家,对于不是很懂代码的同学,一定要谨慎使用此类读取个人数据的项目 / 软件,防止个人隐私的泄露。能看懂代码的同学,可以先全局观察下有没有 “后门” 和发请求的代码,再去使用。不过这个项目 star 数超过 2w,已经很有名气了,没什么问题,可以玩一玩 / 学一学。
有需要的自取。又到了 收藏等于学会 的时候了~
本文转载自:程序员鱼皮
赞
踩
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。