当前位置:   article > 正文

大升级,从V4到V5,Midjourney有了这些新突破_midjourney5

midjourney5

Midjourney v5现已可用——介绍与v4相比的变化!

微信搜索关注《Java学研大本营》,加入读者群,分享更多精彩

Midjourney v5 终于来了,本文主要介绍了其与之前版本 v4 的最新更新和改进。

无论你是 Midjourney 的常客还是新手,此次升级都有望将你的体验提升到一个新的水平。

接下来本文将探索 Midjourney v5 的新功能!

Midjourney v5 介绍

作为商业 AI 图像合成服务,Midjourney 发布了第5版,可以生成更高质量的真实图像,一些 AI 艺术爱好者称其令人毛骨悚然且“太完美了”。

借助 Midjourney v5,流行的 AI 图像生成器的神经网络可以生成极其真实的视觉效果。v5 模型使用尖端工具和新的神经架构来生成美学和设计。

订阅 Midjourney 的 Discord 服务的客户现在可以使用 Midjourney v5 的 alpha 测试版本。

“根据公告,以下内容是更新后的变化:

  • 更广泛的风格范围和更灵敏的提示。

  • 更高的图像质量(分辨率提高2倍),改善动态范围。

  • 更详细的图像。细节更有可能是正确的,减少不需要的文本。

  • 改进了图像提示的性能。

  • 支持 — 无缝平铺的平铺参数(实验性)。

  • 支持 — 纵横比大于2:1(实验性)。

  • 支持 — iw用于权衡图像提示与文本提示。”

来源:https://www.ghacks.net/2023/03/16/midjourney-v5-is-out-how-to-use-it/

更真实的输出图像

除了生成更真实和更详细的图像外,新模型还需要更精确的指令。

根据 Midjourney 发布的说法,一种新的神经架构和新的美学技术已被用于开发该模型,该模型在谷歌云的“人工智能超级集群”上进行了大约五个月的训练。该模型能够产生更真实的图像和更准确的细节。

在第一次的测试中,对于没有明确图像样式的相同提示 V5 会产生更详细的图像,并产生更逼真的结果。在这个例子中,Midjourney v4 生成了一幅插图,而 v5 为提示“一棵由钱组成的树”生成了一个更逼真的博物馆中的装置。作为 v5 的结果,其结果也更接近于预期结果。

Midjourney v4

Midjourney v5

来源:https ://the-decoder.com/midjourney-v5-is-now-available-v4-comparison/

更清晰、更详细的图像

自升级 Midjourney 以来,图像变得更清晰、更细腻。这要归功于在此最新版本中实施的新图像处理算法

正如在 V4 和 V5 的对比中所看到的,V5 生成更清晰、更详细的图像。以下是V4 与V5 依据提示“两个幼儿玩乐高的照片”输出图像的对比,乍一看,V4 的图像看起来很真实。

Midjourney v4

Midjourney v5

来源:https: //www.whytryai.com/p/midjourney-version-5

仔细观察后可以发现,V5 的画面看起来更真实。V4的画面中孩子们的脸看起来像橡胶面具,他们的手看起来乱七八糟,乐高积木看起来像模糊的复制品。而V5 更类似于一张真实的照片,对细节的处理更加出色。

更广泛的支持风格

Midjourney 背后的团队吹捧 V5 的风格范围是 V4 的五倍。

这意味着可以使用更长、更具描述性的提示,可以使用一个完整的句子来提示从风景到建筑的各种视觉效果。

该算法在自然语言处理方面也得到了加强,从而使结果更加准确。

此外,V4 的许多问题也已得到修复,如改进了对大群人的处理,更逼真的手,大部分时间都有正确的手指数量,以及更少的图像伪影。

使用图像提示的结果更加“准确”和可预测

与其前身相比,Midjourney V5 提供了更多样的图像,并且较少限制于特定的艺术风格。

Holz 建议,为了达到理想的效果,有必要使用较长的提示,明确描述图像中的细节,如光线和情绪。

Holz 表示,目前的 v5 模型是一个 alpha 测试版本,在最终发布之前会有重大改变。最终版本与之前的版本一样,将具备更适合初学者的默认风格。

生物形态的摩天大楼和白雪覆盖的山脉:

生物形态的摩天大楼和白雪覆盖的山脉:

来源:https://www.whytryai.com/p/midjourney-version-5

MidJourney V5 更高分辨率

MidJourney 的用户一直希望能升级图像分辨率,该团队宣布即将实现这一目标。

默认情况下,Midjourney V5的图像呈现为1024x1024 像素,比V4 的512x512 像素有所提高。

V4的图像必须经过放大才能达到这个分辨率,所以这是一个重大的改进。在未来,可能会看到V5 升级器可以将分辨率提高到2048x2048 像素。

目前,1024x1024 像素既是默认的也是最大的尺寸。

在更大的格式上使用这些图片,它的分辨率也相当小。可以用另一个使用 AI 的工具放大它们,比如deep-image.ai。

Deep-image.ai允许你自动将图片的分辨率提高4倍--最高可达15,000x15,000 像素。

deep-image.ai 网站

结论

使用新版本的 Midjourney ,用户现在可以享受更多的功能和改进的性能。

开发人员创造了一个易于使用、快速和高效的平台,使每个人都能更容易地跟上他们的任务和项目。

无论是为工作还是个人使用 Midjourney ,如果你想释放你的潜力,v5 绝对值得一试!

推荐书单

《Netty源码全解与架构思维》

Netty是目前市面上使用率较高的网络编程库。它的架构设计非常明确且层次分明,源码较为易懂,其中包装了Java NIO(New IO,新IO)的三大组件:Selector、Channel、ByteBuffer,提供了简单易用高效的网络通信库,其中还实现了自己的内存池管理。Netty的设计基于Jemalloc内存管理库,同时也实现了很多开封即用的应用层协议编码与解码器。本书通过常用的TCP协议完整诠释了Netty的架构设计与思想,省略了Java语言层面的一些基础知识,例如变量、面向对象、泛型等Java SE的基础。

本书适用于以下读者:希望进入互联网公司工作的读者、研究Netty底层知识的读者、在工作中遇见瓶颈,希望通过学习Netty提升底层知识的读者、从事开发高并发支撑中间件的读者、从事互联网高并发业务支撑的读者、对多线程编程感兴趣的读者、希望通过Netty源码找到调优点的读者。

《Netty源码全解与架构思维》(黄俊)【摘要 书评 试读】- 京东图书京东JD.COM图书频道为您提供《Netty源码全解与架构思维》在线选购,本书作者:,出版社:清华大学出版社。买图书,到京东。网购图书,享受最低优惠折扣!icon-default.png?t=N5K3https://item.jd.com/13836258.html

精彩回顾

AIGC时代,用Midjourney设计UI,跟“灵魂画手”说拜拜

一文搞懂Java Servlet

写给初学者的SpringBoot缓存指南

一文搞懂Java中的搜索算法

一文搞懂Java中的排序算法

使用Prometheus和Grafana监控Spring Boot应用

微信搜索关注《Java学研大本营》

访问【IT今日热榜】,发现每日技术热点

本文内容由网友自发贡献,转载请注明出处:https://www.wpsshop.cn/w/weixin_40725706/article/detail/608283
推荐阅读
相关标签
  

闽ICP备14008679号