当前位置:   article > 正文

Datawhale X 魔搭 AI夏令营第四期-魔搭生图task1学习笔记

Datawhale X 魔搭 AI夏令营第四期-魔搭生图task1学习笔记

根据教程提供的链接,进入相应文章了解魔搭生图的主要工作是通过对大量图片的训练,生成自己的模型,然后使用不同的正向、反向提示词使模型输出对应的图片

1.官方跑baseline教程链接:Task 1 从零入门AI生图原理&实践

2.简单列举一下赛事的要求以及任务

  1. 参赛者需在可图Kolors 模型的基础上训练LoRA 模型,生成无限风格,如水墨画风格、水彩风格、赛博朋克风格、日漫风格......

  2. 基于LoRA模型生成 8 张图片组成连贯故事,故事内容可自定义;基于8图故事,评估LoRA风格的美感度及连贯性

 下面详细展示一下,跑baseline的每一步操作

1.开通阿里云交互式建模PAI-DSW

阿里云免费试用 - 阿里云

9ec67b5df7ab495380ad8c91a5410871.png247c2a01de954915847280e5036f2066.png

                4218d90ef0b0467cabb6611677cbfb60.png

2.在魔塔社区进行授权:

https://www.modelscope.cn/my/mynotebook/authorization

5cdd5c9f11574c22a053cd7d1d1781e9.png3104924f7c1248c2980527e7357d5262.pngf75a64b2a0734e1884707f29df4fd367.pngfa308b2164d1423b9873073dc4956429.png

上面的过程图片是取自官方链接,由于个人在操作过程中并没有及时保存,所以将官方图片放置在这里记录一下操作过程

授权成功,选择我的notebook->魔塔平台免费实例->方式二

这里阐明一下选择方式二的原因:新手一定要按教程走,不要自己去尝试在本地跑,我当时拿到任务后就想着是需要在自己电脑上搭建环境再把代码一行行敲进去跑,先使用git把库clone了下来,然后使用pycharm去安装需要的几个包,其中data-juicer这个东西就装了几个小时一直提示包名不对。后来放弃了本地,使用这个平台选了方式一,运行!pip命令下载data-juicer就会出错

解决了安装data-juicer出错之后又在后期使用data-juicer时说没有这个包,折腾了好几个小时都不行,每次到那个地方就会出错。解决了包的问题,后期又在加载模型时,出现“RuntimeError: Found no NVIDIA driver on your system. Please check that you have an NVIDIA GPU”错误   。根据经验,建议选择方式二(血的教训),不过也是我这个小白第一次接触这种工具出现的问题,佬们多担待

ecb123a22ace4a3781bd00892b88c945.png

选择之后,点击启动

0d106bad246c4e5fb97e72207b34703c.png

ec561776d3334c9fb5660035df5484b0.png

选择终端,先使用git命令将我们需要的库下载下来

0525c5325eb340109cf9783cda7a1222.png

git lfs install
git clone https://www.modelscope.cn/datasets/maochase/kolors.git

上面的这两行命令可以一起复制粘贴之后运行:

acf02aa66e5b4964a2fcaea3300fddf6.png

再次出现rootxxxxxx这个用户名就代表下载成功:

34e6f95293ec4b23819054cf4f0b8881.png

左侧菜单栏出现kolors这个文件夹,打开kolors文件夹->baseline.ipynb

834cbdfce51f4b748bc51fcb665c70db.png

选择kernel

ea9388ac9950474d90ebb1d14ac7439a.png

重启一下内核,红色和绿色两种方式都可以

0433d83a3d9d431abab95881528ce211.png

e9ae46670dc445d7aa137616983a5b48.png

开始跑代码:

如果小伙伴们运行顺利的话,直接点击重启内核那个弯曲箭头->双箭头叠加,之后就可以静等代码运行,运行完成就得到了结果

但是我还是那个bug频出的小白,总结下来就是先把第一块pip的所有包安装完成

30aef2346fd14aae9fa1423b425da313.png

 在运行第二块代码之前,手动重置一下内核,之后一直点击,使其运行到最后一行,每一块我都进行了好多次,因为开始几次没有注意每一块的输出,导致到后面出错不知道该怎么办,所以下面给出我每一块运行的结果图片,不一样及时找错误,看是包没下好多下几次,第二步之前重置内核没有(很重要)

执行下载数据集完成后,左侧新增了一个data文件夹

d9b311fb806641f0b79006004308f34f.png

执行处理数据集代码完成:

f3f9bde1808f48bc8402b16c9232a092.png

保存数据集:

9f98a9b8332d4ddba700bcac84771ca3.png

下载模型:

7b66c333c8a34728a71f16f8a27fa878.png开始训练:

 383a12d522904fd4aceac26b79f063cf.png

加载模型:

每次出错都在这个地方,可能就是因为第二步那里的重启内核问题

红线那一行代码出来之后,就出现了CUDA的这个错误

d6ac568f9ee24ce4bd4fef74a78e3276.png

b72aa67f67d442aa80f9ccbfd42de623.png

最后根据描述输出对应图片基本上没有出错,结果成功输出:

4fad5c38153e4403b5a592048d8fc943.png

总结一下,可能就是一开始只是按照自己的想法走没有严格按教程,所以过程出现了很多问题

 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/寸_铁/article/detail/960932
推荐阅读
相关标签
  

闽ICP备14008679号