“在大語(yǔ)言模型領(lǐng)域,DeepSeek在提升效率上有獨(dú)特的認(rèn)知,而效率的優(yōu)化的理念在視頻模型領(lǐng)域已經(jīng)扎根,因此大概率不會(huì)出現(xiàn)這種一下子‘遙遙領(lǐng)先’的模型,我們期待視頻模型更可控、更好用、每個(gè)人都能用到?!鼻迦A大學(xué)人工智能研究院副院長(zhǎng)、生數(shù)科技創(chuàng)始人兼首席科學(xué)家朱軍告訴新京報(bào)貝殼財(cái)經(jīng)記者。


3月27日至31日,2025中關(guān)村論壇年會(huì)舉行。在去年的中關(guān)村論壇上,朱軍發(fā)布了對(duì)標(biāo)Sora的首個(gè)國(guó)產(chǎn)自研視頻大模型Vidu,受到了廣泛關(guān)注。而2025中關(guān)村論壇上,朱軍在主題演講中發(fā)布了業(yè)內(nèi)首個(gè)高可控視頻大模型Vidu Q1,并在會(huì)后接受了新京報(bào)貝殼財(cái)經(jīng)記者的采訪。


朱軍在2025中關(guān)村論壇上發(fā)表演講 新京報(bào)貝殼財(cái)經(jīng)記者 羅亦丹 攝


Q代表“質(zhì)量” 高可控背后是基礎(chǔ)模型能力提升


本次回歸中關(guān)村論壇,朱軍帶來(lái)了更為強(qiáng)大的 Vidu Q1模型,他告訴記者,Q代表“Quality(質(zhì)量)”,即高質(zhì)量、高可控,這本身實(shí)際上是基礎(chǔ)模型能力的提升,“目前階段投入基礎(chǔ)模型的收益還是最大的,加上基礎(chǔ)模型之上的一些技術(shù)創(chuàng)新,從后端可以更好地實(shí)現(xiàn)高一致性和高可控的結(jié)果?!?/p>


貝殼財(cái)經(jīng)記者通過(guò)視頻演示發(fā)現(xiàn),Vidu Q1模型在位置、運(yùn)動(dòng)布局、音頻等多個(gè)領(lǐng)域?qū)崿F(xiàn)了可控升級(jí)。以多主體細(xì)節(jié)可控為例,在語(yǔ)義指令的基礎(chǔ)上,通過(guò)融入?yún)⒖紙D的視覺(jué)指令,Vidu Q1支持對(duì)所有動(dòng)作行為(出場(chǎng)、退場(chǎng)、坐立姿態(tài)、行動(dòng)路線)進(jìn)行精準(zhǔn)調(diào)整,從而用更低的抽卡率實(shí)現(xiàn)更高質(zhì)量的可控生成。


朱軍介紹,Vidu在商業(yè)化方面一直是C端與B端并重,不過(guò)目前C端由于面向全球,增長(zhǎng)速度很快,因此視頻模型的技術(shù)突破可以更好地服務(wù)廣大用戶。而B(niǎo)端則面向國(guó)內(nèi)市場(chǎng),目前已經(jīng)看到了對(duì)MaaS(模型即服務(wù))的廣泛需求,今年也會(huì)繼續(xù)同步推進(jìn)兩種業(yè)務(wù)。


“去年,Vidu在中關(guān)村論壇開(kāi)幕前一周時(shí)實(shí)現(xiàn)了技術(shù)突破,因此也被邀請(qǐng)來(lái)到這樣一個(gè)高端平臺(tái)上進(jìn)行展示。而今年是論壇一周年,也是Vidu大模型的一周年,因此也想在這里傳達(dá)一些進(jìn)展?!敝燔姼嬖V新京報(bào)貝殼財(cái)經(jīng)記者。


視頻模型最重要的是效率 中國(guó)視頻模型引領(lǐng)全球


朱軍表示,目前大語(yǔ)言模型領(lǐng)域有能力非常領(lǐng)先的頭部公司,但視頻模型領(lǐng)域完全不同,“現(xiàn)在可以認(rèn)為中國(guó)的視頻模型在全球,于很多方面是處于引領(lǐng)地位的?!?/p>


“另外,視頻模型的商業(yè)化路徑會(huì)更快,大家對(duì)視頻模型的消費(fèi)和需求非常廣闊,所以視頻和文字的賽道不一樣。目前頭部的視頻大模型各自都有特色、差異化的商業(yè)化的路徑,并沒(méi)有像語(yǔ)言模型處于紅海狀態(tài)?!敝燔娬f(shuō)。


在他看來(lái),視頻大模型的發(fā)展,更重要的還要看團(tuán)隊(duì)能否持續(xù)創(chuàng)新,行業(yè)上公司的密度還比較稀疏,大概率不會(huì)出現(xiàn)一家獨(dú)大的情況。


另外,新京報(bào)貝殼財(cái)經(jīng)記者注意到,今年以來(lái)DeepSeek引領(lǐng)起了大模型的開(kāi)源浪潮,阿里云也推出了開(kāi)源版本的視頻模型。對(duì)此,朱軍回應(yīng)稱,DeepSeek最打動(dòng)用戶的點(diǎn)還是效果好、效率高,“我們認(rèn)為從視頻模型的角度來(lái)說(shuō),用戶最關(guān)心的還是質(zhì)量和效率?!?/p>


記者聯(lián)系郵箱:luoyidan@xjbnews.com

新京報(bào)貝殼財(cái)經(jīng)記者 羅亦丹

編輯 寇德娜

校對(duì) 王心