搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
运维做开发
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
【爬虫实战】Python爬取知网文献信息_python爬虫知网
2
人工智能:重塑语言翻译的未来
3
代码随想录算法训练营day46 | 完全背包、518. 零钱兑换 II、377. 组合总和 Ⅳ
4
爬虫实战系列!淘宝店铺各品牌手机售卖信息爬取及可视化!_爬取商品售量进行可视化分析
5
YOLO的作者们_yolo系列作者是同一个团队吗
6
CI-03T语音控制MP3模块音乐播报
7
JDBC---Java连接数据库_javajdbc连接数据库
8
python手机版破解wifi脚本,python手机版安装教程_termux查看wifi密码
9
vs2017+openni2+opencv343 人脸活体检测_openni 人脸检测
10
北师大蔡苏教授:教育领域VR/AR的三个重点研究方向
当前位置:
article
> 正文
文生图、文生视频领域PaperList [持续更新]
作者:运维做开发 | 2024-07-25 08:54:19
赞
踩
文生图、文生视频领域PaperList [持续更新]
AutoEncoder 【自编码器】 : https://arxiv.org/abs/2003.05991
VAE 【变分自编码器,Diffusion Model的源头】: https://arxiv.org/abs/1906.02691
非均衡热动力学深度无监督学习【Diffusion的理论基础】: https://arxiv.org/abs/1503.03585
DDPM 【第一篇将Diffusion成功应用于图像生成的论文】: https://arxiv.org/abs/2006.11239
DDIM【DDPM之改进和加速】: https://arxiv.org/abs/2010.02502
恺明大神对扩散模型的解剖式分析: https://arxiv.org/abs/2401.14404
DiT【据说是SORA和SD3的基础架构】:https://arxiv.org/abs/2212.09748
CLIP 【文生图的基础,文图统一embedding】: https://arxiv.org/abs/2103.00020
ControlNet 【基于SD进行风格控制】: https://arxiv.org/abs/2302.05543
LoRA 【轻量级插件头以实现形象保持】: https://arxiv.org/abs/2106.09685
Dreambooth 【主体保持】: https://arxiv.org/abs/2208.12242
Stable Diffusion 【最好的开源文生图】: https://arxiv.org/abs/2112.10752
SDXL 【SD的改进】: https://arxiv.org/abs/2307.01952
SORA 技术报告: https://openai.com/research/video-generation-models-as-world-simulators
SD3【报告尚未出,但宣称用了DiT和
Flow Matching
】: https://stability.ai/news/stable-diffusion-3
DALL·E【OpenAI出品】: v1: https://arxiv.org/abs/2102.12092, v2: https://cdn.openai.com/papers/dall-e-2.pdf, v3: https://cdn.openai.com/papers/dall-e-3.pdf
SAM 【经典的分割一切模型】: https://github.com/facebookresearch/segment-anything?tab=readme-ov-file
SVD 【Stability.AI 出品的视频生成】: https://stability.ai/research/stable-video-diffusion-scaling-latent-video-diffusion-models-to-large-datasets
V-JEPA 【Meta出品文生视频】: https://ai.meta.com/blog/v-jepa-yann-lecun-ai-model-video-joint-embedding-predictive-architecture/
本文内容由网友自发贡献,转载请注明出处:
【wpsshop博客】
推荐阅读
article
自动驾驶
Motion
Plan
之
轨迹
生成
代码实现...
文章开始前先回顾下上次的带约束的
轨迹
生成
,
轨迹
生成
本质就是曲线拟合。曲线拟合常用的方法有:多项式、贝赛尔曲线、三次样条差...
赞
踩
article
今年
,
自动
驾驶
彻底爆
了
!...
今年来
,
各家
自动
驾驶
与AI公司开始规模化量产
,
可落地的技术成为大家争先占领的重点
,
然而这个行业对从业者能力要求较高
,
内部...
赞
踩
article
分享官方提供
的
JESD2
0
4B
故障排除技巧
_
jesd2
0
4b
输出
数据
为
0
...
JESD2
0
4B
常见故障排查
_
jesd2
0
4b
输出
数据
为
0
jesd2
0
4b
输出
数据
为
0
...
赞
踩
article
元
学习
:
Agent
的
快速
适应
与
学习
策略_ai
agent
的
提示
学习
...
1. 背景介绍随着人工智能
的
迅猛发展,
Agent
(智能体)在各种复杂环境中
学习
和
适应
的
能力变得越来越重要。传统
的
机器
学习
...
赞
踩
article
使用
Spring
Boot
整合
Kafka
:实现高效的
消息传递
...
在这篇文章中,我们介绍了如何
使用
Spring
Boot
整合
Kafka
。我们学习了如何配置和
使用
Spring
Bo...
赞
踩
article
MongoDB
中
remove
与
deleteMany
的
区别?...
deleteMany
/
remove
都可以添加writeConcern参数,表明是否关注writeConcernWhat’...
赞
踩
article
2022最新
CSS
高频面试题指南_
为什么
block
级
元素
比它
包含
的
某些
元素
更高?...
大家好,我是CoderBin,本文将总结75道前端面试
CSS
中
的
高频考点,帮助同学们力闯秋招,赶快收藏起来学习啦
为什么
...
赞
踩
article
人工智能
大
模型
技术基础系列之:
深度
学习
模型
分布式
训练
_ai
分布式
训练
...
作者:禅与计算机程序设计艺术 1.简介
深度
学习
(Deep Learning)近年来在图像、语音、自然语言等领域广...
赞
踩
article
Git
– 错误:
拒绝
合并
不相关
的
历史
_
git
拒绝
合并
无关
的
历史
...
自然,您想
合并
分支,但您
的
Git
工具可能会
拒绝
合并
它们,因为分支具有“不相关
的
历史
”。我将展示我在使用
Git
Hub...
赞
踩
article
DRL2024
-
深度
强化学习...
本书的目的是提供
深度
强化学习领域的全面概述。本书是为人工智能的研究生,以及希望更好地理解
深度
强化学习方法及其挑战的研究人...
赞
踩
article
自动驾驶-机器人-
slam
-定位面经
和
面试
知识系列03之
C++
STL
面试
题(01)...
自动驾驶-机器人-
slam
-定位面经
和
面试
知识系列03之
C++
STL
面试
题(01)自动驾驶-机器人-
slam
-定位面经
和
...
赞
踩
article
Python
安装
fitz
提示 Module Not
Found
Error: No modul...
Python
安装
fitz
/ PyMuPDF 提示 Module Not
Found
Error: No modul...
赞
踩
article
一款好用的
扫描
爆破
工具
_
goon
扫描
...
网络安全行业产业以来,随即新增加了几十个网络安全行业岗位︰网络安全专家、网络安全分析师、安全咨询师、网络安全工程师、安全...
赞
踩
article
【
信号
分解
】基于
极点
对称
模态
分解
ESMD
实现
信号
分解
附
Matlab
代码...
【
信号
分解
】基于
极点
对称
模态
分解
ESMD
实现
信号
分解
附
Matlab
代码【
信号
分解
】基于
极点
对称
模态
分解
ESMD
实现
信号
分...
赞
踩
article
大
模型
公开课
:探索
人工智能
的
未来与
挑战
_
大
模型
算法
挑战
...
在
人工智能
领域,
大
模型
(Large Models)正逐渐成为研究和应用
的
热点。这些
模型
因其庞
大
的
规模和强
大
的
计算能力,被...
赞
踩
article
无框架从零
实现
Agent
_
agent
从
0
实现
...
思考和推理有了,记下来我们定一下动作。
Agent
有了行动的能力,无论是执行函数还是调用工具,
Agent
才完整。把所...
赞
踩
article
Deeplearning4j
: 用
Java
实现
深度
学习
框架_
java
deeplearning4...
作者:禅与计算机程序设计艺术 1.简介
深度
学习
是一个极具吸引力的新领域,尤其是在计算机视觉、自然语言处理等领域。...
赞
踩
article
『运维
备忘录
』之
iptables
防火墙
使用指南
_
iptables
开放
端口
命令
保存
命令
...
最近很多小伙伴找我要Linux学习资料,于是我翻箱倒柜,整理了一些优质资源,涵盖视频、电子书、PPT等共享给大家!_ip...
赞
踩
article
大
语言
模型
驱动的智能
对话
新纪元:
上下文
理解与
多轮
对话
生成
技术揭秘_大
模型
多轮
对话
...
此外,层次化强化学习方法,如分层策略梯度(Hierarchical Policy Gradient),通过在不同的
对话
粒...
赞
踩
article
基于
MATLAB
的
机器人
避碰
路径
规划_
matlab
路径
避开
小球...
在每一步中,我们执行所选择
的
动作,并观察下一个状态和奖励。根据观察到
的
状态、动作、下一个状态和奖励,我们更新深度神经网络...
赞
踩
相关标签
自动驾驶
人工智能
机器学习
MOTION
plan
轨迹生成
代码
fpga开发
计算科学
神经计算
深度学习
神经网络
大数据
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
spring boot
kafka
java