- 发布日期:2024-04-13 11:47 点击次数:164
东说念主工智能领域又有新进展。
可和会视频实质的MiniGPT4-Video面世
东说念主工智能领域又有新进展。跟着MiniGPT4-Video的问世,视频和会这项窒碍有了显赫的龙套。
据报说念,4月4日,KAUST和哈佛大学连系团队发表的论文中提倡MiniGPT4-Video框架——专为视频和会而盘算的多模态大模子。该模子或然处置时代视觉和文本数据,使其或然熟悉地和会视频的复杂性。MiniGPT4-video不仅接头视觉实质,还集成了文本对话,允许模子有用地复兴波及视觉和文本组件的查询。
举例,MiniGPT4-Video或然为宣传视频配出标题、宣传语;也不错对视频的处置经由进行和会。MiniGPT4-Video以至不错笔据视频实质进行诗歌创作、实质证据等。这意味着,MiniGPT4-Video在处置复杂视频实质时阐扬亮眼,提供高质料的输出。
据悉,该模子优于现存的发轫进的标准,在MSVD、MSRVTT、TGIF和TVQA基准上差别提高了4.22%、1.13%、20.82%和13.1%,模子和代码已公开。但当今的残障在于险阻文窗口限制。下一步,团队将连系模子能力延迟到处置更长视频的能力。
多模态见识股出炉
AI视频果决成为多模态LLM发展的大趋势。总的来说,MiniGPT4-Video的出现是AI在视频和会领域迈出的一大步。跟着将来连系的箝制深化,有连系东说念主员合计,MiniGPT4-Video将在多模态东说念主工智能领域阐扬愈加遑急的作用。
据证券时报·数据宝不十足统计,网上配资A股市集的多模态大模子见识股所有13只。从净利润变动来看,大华股份和万兴科技2023年净利润同比翻倍,增幅轮番为217.1%、112.1%。另有拓维信息、佳齐科技、北信源等拒绝扭亏为盈。
近期,大华股份在互动平台暗意,公司在通讯能力方面,围绕相聚伙同工夫、数据交换工夫和前沿相聚工夫三个方面,打造和会伙同能力体系,通讯和伙同工夫的握续率先,有助于复古物联网向视联网升级。公司发布了星汉大模子,和会图像、点云、文本、语音等多模态数据,拒绝了准确性和泛化性的跃升,大幅擢升视觉贯通能力。
万兴科技旗下“天幕”大模子以音视频生成式AI工夫为基础,由视频、音频、图片和话语大模子构成,涵盖文生视频、文生3D视频、视频AI配乐、数字东说念主播报等近百项音视频原子能力,同期支握公共不同话语,关联能力已在Wondershare Filmora、Wondershare Virbo等国外家具上边界化商用。
- 咱们的使命将来将被AI取代?近日,特斯拉CEO马斯克在接收媒体采访时2024-05-27
- AI观念股全线下挫 拓维信息跌超9% 云盘算50ETF(516630)午后跌超2%2024-05-11