来源: 网络 ,如有侵权请联系删除。如果您觉得对你有帮助的话,记得关注我们,我们会出更好的内容。
12日讯,阿里达摩院的研究人员提出了Video-LLaMA,一个具有综合视听能力大模型。Video-LLaMA能够感知和理解视频中的视频和音频信号,并能理解用户输入的指令,完成一系列基于音视频的复杂任务,例如音/视频描述,写作,问答等。目前论文,代码,交互demo都已开放。另外,在Video-LLaMA的项目主页中,该研究团队还提供了中文版本的模型,让中文用户的体验更好。
(资料图片仅供参考)
论文链接:
代码地址:https://github.com/DAMO-NLP-SG/Video-LLaMA
Demo 地址:
Modelscope: https://modelscope.cn/studios/damo/video-llama/summary
Huggingface: https://huggingface.co/spaces/DAMO-NLP-SG/Video-LLaMA
样例输入文件地址:
https://github.com/DAMO-NLP-SG/Video-LLaMA/tree/main/examples
T HE EN D
温馨提醒&广告
郑重声明: 本文绝非小编编写,版权归原作者所有,转载文章仅为传播更多信息之目的,如涉及作品内容、版权和其它问题,请在30日内与本网联系,我们将在第一时间删除内容!
上一篇:前4月完成交通固定资产投资1万亿元 同比增13.4%
下一篇:最后一页
记者从上海市交通委员会执法总队获悉,在道路严格管控期间,“货拉拉”网络货运平台违规发布召车信息、派发订单,为驾驶员从事非法客运、高
编者按: 每一个努力生活的中国人,都是最美的奋斗者。也正是因为亿万奋斗者,才有了今日之中国。十年,致敬每一个奋斗的你。让我们一起,踔
中新网永州5月23日电 (谢助民 唐毅刚)每天上午,在湖南东安县中天职业培训学校教室,炒菜师傅唐远江都准时教学员做东安鸡。红椒丝、姜丝
中新网福州5月23日电 (郑江洛)福建省公安厅出入境管理局局长郑荫源23日在此间披露,今年以来,福建共侦破妨害国(边)境管理犯罪案件378起,
中新网福州5月23日电 (郑江洛)“2017年至2021年,全省社会治安呈现‘两降三升’良好态势。”福建省公安厅党委委员、副厅长黄华安23日在此
X 关闭
X 关闭