当前位置:   article > 正文

AI又进化了,突破性革命来了_wav2lip下载

wav2lip下载

大家好,我是 Jack。

2023 年,AI 真的杀疯了。短短不到一年的时间,当我们还在感慨 AI 一键生成的二次元画作精美万分的时候,它已经进化到了写实美照也能手到擒来的地步。

更多的效果,可以看刚刚发布的视频,求个免费的赞啦

https://www.bilibili.com/video/BV1X24y1n77u/

今天分享一下可以学习的资源。

本文档可以随意分享给你的好基友/好闺蜜AI绘图走起! 

1、Stable Diffusion WebUI

这个项目是 Stable Diffusion 算法的 Web 版,就是增加了一个 Web 交互界面,方便运行算法。

我出过这个项目的部署视频,不了解的可以先看这个视频:

https://www.bilibili.com/video/BV1q84y1i78L/

视频提到的一键安装包,已经有些老了,可以用最新的(提取码:dcng):

https://pan.baidu.com/s/1c8pLEpu514xmWdsUAJ_lXQ?pwd=dcng

想要运行代码,需要有 python 环境,这个自己安装吧,视频有讲解,然后运行指令:

python launch.py

这样就能启动 Web 页面了。

里面已经包含了文章开头的所展示的真人生成模型、Lora模型等。

还有汉化插件、ControlNet插件等。

2、模型分享网站

网友很强大,训练好的模型,还有一些 prompt 参数,都有人分享。

模型资源很多,可以看看这里:

https://civitai.com/

比如第二个 ChilloutMix,就是一个效果非常好的真实图片生成模型。

点击这里就能下载了。

下载好后的模型,需要放到工程目录的:models/Stable-diffusion 里。

这个我已经打包好了。

除了这种模型可以下载,还能下载 Lora 模型,可以理解为这个是一种画风的小模型,可以配合 Stable Diffusion 模型一起使用,放在 prompt 中。

比如我已经安装好了一个 koreanDollLikeness_v10 Lora 模型,就可以使用以下步骤找到:

选中这个模型,会自动生成 prompt 指令, <lora:koreanDollLikeness_v10:1>,最后跟着的 1 就是权重,可以是0.1,也可以是1,甚至2,数越大使用的权重越多。

模型也是可以在 civitai 下载:

比如第一个就是上文所展示的 Lora 模型开源页面。下载好的模型,需要放到 models/Lora 目录下:

3、第三方插件

这个项目还支持我们安装第三方扩展插件,比如汉化插件、集成ControlNet的插件。

汉化插件下载地址:

https://github.com/dtlnor/stable-diffusion-webui-localization-zh_CN

直接打包下载 ZIP 压缩包:

然后将文件解压放到 extensions 目录下:

我们重启 Web 服务:

勾选上插件,就能使用了:

然后在 Show all pages 里:

英文直接搜 local 就能找到,选择 zh_CN 即可完成汉化。

记得设置完,重新 Web 生效。

ControlNet 插件下载同理。

https://github.com/Mikubill/sd-webui-controlnet

直接下载文件,并放到指定目录即可(extensions)。

这个不用额外配置,放到指定目录后,重启就可以看到生效了:

想要使用 ControlNet 需要提前下载好权重文件:

https://huggingface.co/toyxyz/Control_any3/tree/main

比如这个姿态估计模型:

点击下载按钮即可下载,下载好的模型放到工程目录的 extensions/sd-webui-controlnet/models 中即可。

4、其它

1)ChatGPT

chatgpt的使用,我出过一期视频:

https://www.bilibili.com/video/BV1yP4y1Q7PH/

对应的注册教程:

https://docs.qq.com/doc/DT2FEQXNZcE1hUFZ3

2)Wav2lip

Wav2lip就是语音转音频,这个算法老了一些,可以看看是否有更新的。

2020年,这个算法刚出的时候,我第一时间写过简单的文字版教程:

https://mp.weixin.qq.com/s/6AP_Dl4T75lkviPAOJyHDA

项目地址:

https://github.com/Rudrabha/Wav2Lip

3)Chat-GPT-LangChain

已经有集文本对话、语音识别、表情驱动的项目了,虽然目前效果有限,但对这方面感兴趣的,可以提前看看,做个调研够用了:

项目地址:

https://huggingface.co/spaces/JavaFXpert/Chat-GPT-LangChain

5、絮叨

近两年是 AI 爆发的两年,无论是文本领域还是图片领域,都有了突破性的进展。

各种 AI 技术,我会持续分享,感谢各位小伙伴一直以来的关注与支持啦~

期待你在这里有所收获,有所感触,悄悄拔节,惊艳所有~

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/AllinToyou/article/detail/323369
推荐阅读
相关标签
  

闽ICP备14008679号