赞
踩
这个moondream是一个视觉模型,你可以用这个视觉模型问它关于图片的所有问题,也就是你上传一张图片给它,你就可以问它关于这张图片的所有问题,这个安装很简单,项目已经在github上开源了,如下
GitHub - vikhyat/moondream: tiny vision language model
上传图片,问它问题,点击按钮,就是这么简单,你可以让它描述一下图片的内容,这个可以用来反推提示词哈,然后问它图片中的人物叫什么名字,穿什么颜色的衣服,都是可以问的,只要关于这张图片的所有问题,它都可以回答,它所需要的模型如下
它也可以在comfyui上使用了,如下
GitHub - kijai/ComfyUI-moondream: ComfyUI node to use the moondream tiny vision language model
用这个节点就行,如果网络不好,手动把模型放到下面的目录中就行,如下
使用很简单,使用MoondreamQuery这个节点就行
如下
然后左边拉出一个载入图像节点,用来上传图片,然后右边拉出一个展示文本节点,用来显示它的回答,即如下
然后在红色圈住的地方问它关于上传图片的问题,这样就行了
【干货分享】前两天开源的视觉模型Moondream可以在ComfyUI上使用了,这次讲讲它的部署和简单使用
星球号:32767063
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。