赞
踩
大家好,今天继续聊聊 AI 科技圈发生的那些事。分享几个最新好玩、实用的AI工具。更多最新技术,文末加入我们。
LivePortrait:一款可以轻松让一幅肖像栩栩如生的工具
它可以精准操控眼睛和嘴唇动作:
让静态照片变为流畅动态视频,颠覆传统动画制作,处理多人物肖像无缝拼接,自然流畅。
解决传统动画制作难题,高质量高效率,精确控制眼睛和嘴唇动作,微表情逼真。
采用先进技术方法,生成速度快,支持多风格肖像,提供更多创意空间。
案例
使用方法
1、克隆代码并准备环境
git clone https://github.com/KwaiVGI/LivePortrait
cd LivePortrait
# create env using conda
conda create -n LivePortrait python==3.9.18
conda activate LivePortrait
# install dependencies with pip
pip install -r requirements.txt
2、下载预训练权重
pretrained_weights
├── insightface
│ └── models
│ └── buffalo_l
│ ├── 2d106det.onnx
│ └── det_10g.onnx
└── liveportrait
├── base_models
│ ├── appearance_feature_extractor.pth
│ ├── motion_extractor.pth
│ ├── spade_generator.pth
│ └── warping_module.pth
├── landmark.onnx
└── retargeting_models
└── stitching_retargeting_module.pth
3、推理
python inference.py
微软最近开源 GraphRAG,构建知识图谱增强大模型的问答、推理等能力
GraphRAG 通过构建实体知识图谱来增强大模型的搜索、问答、摘要、推理等能力,特别擅长处理大规模数据集。
GraphRAG 的核心包括构建实体知识图谱和生成社区摘要两个步骤,通过社区摘要提取数据集中相关信息,生成更全面和准确的答案。
GraphRAG 对 tokens 的需求很低,能够帮助开发者节省成本。在综合测试中表现优异,是目前最佳的RAG方法之一。
基于 Python 的开源将在https://aka.ms/graphrag
上发布
Fish Speech 完美支持中英日语言的开源TTS模型
语音处理接近人类水平
模型使用约十五万小时三语数据训练,对中文支持非常的完美。
该项目由 fishaudio 开发,作为一个仅有亿级参数的模型,Fish Speech 设计高效轻量,可以在个人设备上轻松运行和微调,成为您的私人语音助手。
使用方法
Github:https://github.com/fishaudio/fish-speech
技术要学会分享、交流,不建议闭门造车。一个人可以走的很快、一堆人可以走的更远。
成立了大模型算法技术交流群,相关资料、技术交流&答疑,均可加我们的交流群获取,群友已超过2000人,添加时最好的备注方式为:来源+兴趣方向,方便找到志同道合的朋友。
方式①、微信搜索公众号:机器学习社区,后台回复:加群
方式②、添加微信号:mlc2040,备注:来自CSDN + 技术交流
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。