赞
踩
视频剪辑这块,传统做法还是不少的,但是我认为目前比较合理的还是基于多模态大模型(基于大模型的视频理解)的做法更好,扩展性更强,否则还是避免不了写一些逻辑和场景受限。
1.transnetv2
目前用的,主要是切的镜头
2.SOONet
魔搭社区汇聚各领域最先进的机器学习模型,提供模型探索体验、推理、训练、部署和应用的一站式服务。https://www.modelscope.cn/models/iic/multi-modal_soonet_video-temporal-grounding/summary
3.FunClip
魔搭社区汇聚各领域最先进的机器学习模型,提供模型探索体验、推理、训练、部署和应用的一站式服务。https://www.modelscope.cn/studios/iic/funasr_app_clipvideo/summary通过音频来裁剪视频。
4.ADPN
5.LLaMA-VID
6.VideoLLaMA
7.MiniGPT4-Video