文生視頻落地加速,用AI生成虛擬人視頻只需百元了
分類(lèi): 最新資訊
簽名詞典
編輯 : 簽名大全
發(fā)布 : 03-28
閱讀 :392
界面新聞?dòng)浾?| 佘曉晨界面新聞編輯 | 劉方遠(yuǎn)自AI爆火以來(lái),技術(shù)取代人類(lèi)勞動(dòng)力的討論就不絕于耳。如今這樣的現(xiàn)實(shí)確實(shí)在發(fā)生——企業(yè)用一套AI工具生成3D虛擬人視頻,比采用人工制作的成本要低上20倍。實(shí)踐者之一來(lái)自于金融行業(yè)。東吳證券每天需要更新大量資訊類(lèi)視頻,平均每天產(chǎn)出一條熱門(mén)板塊點(diǎn)評(píng)、大盤(pán)回顧、財(cái)經(jīng)早報(bào)等等。類(lèi)比同類(lèi)券商,其使用模版的價(jià)格達(dá)到平均每條2000元,定制一條則需2到3萬(wàn)元。使用魔琺科技的文生視頻產(chǎn)品“有言”后,東吳證券生產(chǎn)一條2分鐘的視頻,成本可以降到百元左右。 圖片來(lái)源:截取自東吳證券產(chǎn)品發(fā)布視頻在一些公司喊出“追趕Sora”的口號(hào)時(shí),另一些從應(yīng)用出發(fā)做產(chǎn)品的國(guó)內(nèi)公司,開(kāi)始探索自己的AIGC路徑,上述案例就此誕生。魔琺科技專(zhuān)注于3D虛擬人業(yè)務(wù),超寫(xiě)實(shí)國(guó)風(fēng)虛擬人“翎Ling”就出自該公司之手。公司創(chuàng)始人兼CEO柴金祥畢業(yè)于美國(guó)卡內(nèi)基梅隆大學(xué)人工智能&機(jī)器人學(xué)專(zhuān)業(yè),是計(jì)算機(jī)視覺(jué)、計(jì)算機(jī)圖形學(xué)以及智能交互領(lǐng)域的專(zhuān)家。此前魔琺科技已經(jīng)搭建了3D虛擬人AIGC開(kāi)放平臺(tái),今年3月,公司正式發(fā)布原生3D內(nèi)容AIGC產(chǎn)品“有言”。“有言”產(chǎn)出3D視頻的流程是生成內(nèi)容、編輯鏡頭和視頻包裝,通過(guò)AI手段,做到一鍵輸出三維動(dòng)畫(huà)、三維超寫(xiě)實(shí)形象、三維運(yùn)鏡和聲音等。據(jù)公司向界面新聞介紹,截至目前,該產(chǎn)品已積累了近50家公司的落地案例。企業(yè)用“有言”來(lái)生產(chǎn)虛擬人視頻的需求集中在營(yíng)銷(xiāo)、培訓(xùn)等不同的場(chǎng)景,但核心的訴求都圍繞“降本增效”。例如東吳證券,除了用“有言”生產(chǎn)資訊播報(bào)類(lèi)視頻之外,還會(huì)在線(xiàn)下活動(dòng)中使用3D虛擬人視頻進(jìn)行技術(shù)發(fā)布和路演,在提升宣傳效果的同時(shí),節(jié)省人工拍攝和準(zhǔn)備的成本。事實(shí)上,“有言”代表了一類(lèi)國(guó)內(nèi)科技公司探尋技術(shù)應(yīng)用的方式:做低門(mén)檻產(chǎn)品,優(yōu)先注重落地和可上手。而在文生視頻領(lǐng)域,這和Sora的探索屬于不同的路徑。柴金祥在接受界面新聞等媒體采訪(fǎng)時(shí)表示,有言主打的是高效率、低門(mén)檻,希望在信息傳達(dá)類(lèi)場(chǎng)景中落地,例如產(chǎn)品發(fā)布、品牌宣傳、新聞播報(bào)。其技術(shù)路徑是AI生成3D內(nèi)容,通過(guò)引擎的方式渲染出視頻。而Stable Diffusion、Runway、Pika和Sora屬于另一類(lèi)AI文生視頻產(chǎn)品:用大量的視頻數(shù)據(jù)訓(xùn)練大模型。Sora面世之時(shí),行業(yè)對(duì)其的討論就包含了應(yīng)用上的質(zhì)疑——它離真正的商業(yè)化落地還有些距離。浙商證券也在研報(bào)中提出,對(duì)于業(yè)態(tài)更加復(fù)雜的長(zhǎng)視頻和游戲,受限于模型還無(wú)法準(zhǔn)確理解因果關(guān)系及其他技術(shù)難點(diǎn),現(xiàn)階段Sora及同類(lèi)產(chǎn)品或以提供美術(shù)靈感支持為主。 柴金祥解釋稱(chēng),Sora在一定程度上解決了時(shí)空的一致性,并且在時(shí)長(zhǎng)上有了較大提升,但它走2D視頻生成路線(xiàn),更適合創(chuàng)意類(lèi)視頻生成,不適合“高信息密度”以及“內(nèi)容需要精準(zhǔn)控制”的視頻內(nèi)容。這是“有言”希望填補(bǔ)的場(chǎng)景。而在具體實(shí)踐中,有言的能力和當(dāng)下企業(yè)的使用場(chǎng)景是否適配?事實(shí)上,自虛擬人火爆之后,企業(yè)使用產(chǎn)品自己生成虛擬人視頻的需求就一直存在,畢竟定制一個(gè)虛擬人需要付出的成本極高——根據(jù)不同的精細(xì)程度,需要花費(fèi)幾萬(wàn)到幾十萬(wàn)不等的價(jià)格。但過(guò)去的數(shù)據(jù)和技術(shù)能力不足。做超寫(xiě)實(shí)虛擬人時(shí),魔琺科技服務(wù)了幾百家B端(企業(yè))客戶(hù),公司在這一過(guò)程中積累大量3D數(shù)據(jù),憑借此逐步開(kāi)發(fā)出AIGC產(chǎn)品,產(chǎn)出質(zhì)量也有所提升。“坦白說(shuō),我們以前用純手工做的,還沒(méi)有現(xiàn)在AIGC的效果好。”柴金祥稱(chēng)。 目前,“有言”的應(yīng)用集中在金融證券、3C家電、美妝快消和廣電領(lǐng)域。對(duì)虛擬人視頻的需求相對(duì)簡(jiǎn)單和規(guī)范化的客戶(hù),更愿意買(mǎi)單。以海爾集團(tuán)為例,過(guò)往企業(yè)采用圖文剪輯或者真人拍攝的形式制作不同類(lèi)型的視頻,現(xiàn)在可以實(shí)現(xiàn)平均每天生產(chǎn)30多條視頻,用于經(jīng)銷(xiāo)商培訓(xùn)、產(chǎn)品介紹等。美妝品牌自然堂使用“有言”生產(chǎn)大量種草視頻、產(chǎn)品講解視頻以及內(nèi)部培訓(xùn)視頻,使用產(chǎn)品2周多,各部門(mén)的視頻生產(chǎn)量達(dá)到數(shù)百支。回到文生視頻的大賽道上,其落地的潛力已經(jīng)為外界認(rèn)可。中信證券在研報(bào)中指出,在生成式AI的諸多發(fā)展方向中,文生圖、文生視頻有望率先迎來(lái)商業(yè)化落地。根據(jù)華泰證券研報(bào),2023年實(shí)際誕生文生視頻大模型達(dá)到數(shù)十個(gè),全球用戶(hù)數(shù)量超過(guò)百萬(wàn)級(jí)別。這讓市場(chǎng)競(jìng)爭(zhēng)變得集中而激烈。國(guó)內(nèi)公司多數(shù)在B端進(jìn)行文生視頻的商業(yè)化嘗試,探索落地可能性。已在軟件上布局的公司早就聞風(fēng)而動(dòng),3月以來(lái),一眾創(chuàng)業(yè)公司也陸續(xù)收獲融資。但這些公司亦有不同的發(fā)力方向。如A股上市公司萬(wàn)興科技瞄準(zhǔn)泛娛樂(lè)垂直市場(chǎng),發(fā)布的產(chǎn)品包含文生視頻、視頻AI配樂(lè)等,核心是以音視頻生成式AI技術(shù)為基礎(chǔ)的多媒體創(chuàng)作垂類(lèi)大模型,落地領(lǐng)域集中在游戲和影視行業(yè),將產(chǎn)品提供給B端企業(yè)。創(chuàng)業(yè)公司也有各自的選擇。文生視頻AI公司愛(ài)詩(shī)科技在3月完成億元級(jí)人民幣A1輪融資,主要研發(fā)視頻大模型和國(guó)民級(jí)AI應(yīng)用,大規(guī)模的C端(消費(fèi)者)應(yīng)用是其努力的方向。在3月12日完成新一輪數(shù)億元融資的生數(shù)科技則用“兩條腿走路”,一方面以API的形式向B端提供模型能力,另一方面也研發(fā)垂類(lèi)應(yīng)用產(chǎn)品,以訂閱等形式推出AIGC平臺(tái)。在推出B端服務(wù)后,今年魔琺科技同樣要在“有言”的C端版本上加大投入。長(zhǎng)期來(lái)看,這些產(chǎn)品要面臨的共同難題是盈利。即使上述路徑已經(jīng)有明確的落地案例,什么樣的產(chǎn)品會(huì)最先成為商業(yè)化的排頭兵,答案還未清晰。柴金祥認(rèn)為,到了產(chǎn)品化的階段,所有的成本就是GPU的成本,無(wú)論服務(wù)C端消費(fèi)者還是B端企業(yè)都一樣。因此他認(rèn)為,對(duì)所有的科技企業(yè)來(lái)說(shuō),最重要的是找到PMF(Product Market Fit,產(chǎn)品市場(chǎng)匹配度)和產(chǎn)品壁壘。