赞
踩
SEED-Story 是一种能生成包含一致性图像的多模态长篇故事的机器学习模型,配套数据集已开放。
SEED-Story 是一种多模态长故事生成模型,具备生成包含丰富且连贯的叙事文本和一致性高的人物和风格图像的能力。此模型基于 SEED-X 构建。为了训练和评估多模态故事生成,SEED-Story还发布了一个大规模数据集 StoryStream。
多模态故事生成:从用户提供的初始图像和文本生成包含文本和图像的长故事。生成的故事在人物和风格上一致,最多可包含25个多模态序列。
一致性调整:在生成图像和文本时,能够保证图像风格和人物形象的一致性。
多样化生成:即使提供相同的初始图像,不同的初始文本可以引导生成不同的发展故事。
可用于:
儿童故事书生成:通过输入一些简单的文字和图片,可以生成完整的故事,适用于儿童电子书和纸质书的创作。
广告和营销:根据初始的品牌图片和文本描述,生成一系列连贯的广告宣传素材。
教育与培训:生成包含图文并茂的教材,帮助学生通过图像和故事更好地理解知识。
游戏和娱乐:自动生成游戏剧情和角色设定,减少开发者的创作负担。
地址:https://github.com/TencentARC/SEED-Story
GraphRAG本地版结合Ollama和交互式UI,支持本地模型并提供3D可视化和文件管理功能。
GraphRAG Local with Ollama and Interactive UI 是微软GraphRAG项目的本地化版本,专门为支持Ollama本地模型并集成了新的交互式用户界面而改编。
地址:https://github.com/severian42/GraphRAG-Ollama-UI
FLAIR是一种利用长视距离的机器人操作系统,用于控制多自由度机械臂进行逼真食品的进食操作。
FLAIR(Feeding via Long-horizon AcquIsition of Realistic dishes)是一个用于远程喂食的机器人系统。它支持几种机器人手臂平台,包括Kinova 6-DoF或7-DoF机械臂和Franka Emika Panda 7-DoF机械臂。FLAIR使用一个定制的喂食器具,其中包括专门处理面条的分割模型,通过视觉和深度信息来准确地抓取和喂食食物。
FLAIR系统主要应用于辅助那些无法自行用餐的人群,包括老年人、行动不便的患者等。系统通过高精度的视觉和深度感知,能够在复杂的用餐场景中进行自主化喂食,提高他们的生活质量和自理能力。
地址:https://github.com/empriselab/FLAIR
VectorVein是一款无需编程即可创建强大AI工作流程的无代码软件。
VectorVein是一款无代码AI工作流软件,受LangChain和langflow启发,旨在结合大型语言模型的强大能力,使用户能够轻松实现各种日常任务的智能化和自动化工作流。无需编程,仅通过拖拽即可创建强大的工作流。
地址:https://github.com/AndersonBY/vector-vein
MediaGo是一款支持m3u8视频提取和流媒体下载的多功能工具。
MediaGo 是一个支持 m3u8 视频在线提取和流媒体下载的工具。该软件具备以下主要特点:
无需抓包:内置浏览器能自动嗅探网页中的视频资源,用户可以从资源列表中选择下载,操作简便。
移动播放:支持 PC 和移动设备间无缝切换,下载后可在手机上观看视频。
批量下载:支持同时下载多个视频和直播资源,充分利用高速带宽。
地址:https://github.com/caorushizi/mediago
更多AI工具,参考国内AiBard123,Github-AiBard123 公众号:每日AI新工具
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。