據(jù)晚點(diǎn)報(bào)道,愛(ài)詩(shī)科技近期完成3億美元C輪融資,由鼎暉投資領(lǐng)投,超過(guò)20家機(jī)構(gòu)參與,創(chuàng)下中國(guó)視頻生成領(lǐng)域最大單筆融資紀(jì)錄。
這家成立近三年的公司,2025年底年度經(jīng)常性收入已超過(guò)4000萬(wàn)美元,旗下PixVerse及拍我AI總用戶數(shù)超1億,月活突破1600萬(wàn)。
愛(ài)詩(shī)科技創(chuàng)始人王長(zhǎng)虎曾擔(dān)任字節(jié)跳動(dòng)視覺(jué)技術(shù)負(fù)責(zé)人,完整參與了抖音和TikTok從0到1的視覺(jué)技術(shù)架構(gòu)建設(shè)。2023年他創(chuàng)辦愛(ài)詩(shī),核心團(tuán)隊(duì)多來(lái)自字節(jié)、微軟等科技巨頭。
今年1月,愛(ài)詩(shī)發(fā)布PixVerse R1,宣稱是全球首個(gè)通用實(shí)時(shí)世界模型,支持1080P分辨率流式視頻生成,用戶可在生成過(guò)程中隨時(shí)插入新指令,畫(huà)面隨之動(dòng)態(tài)調(diào)整。這一"實(shí)時(shí)交互"的探索路徑,試圖將視頻生成從"結(jié)果導(dǎo)向"轉(zhuǎn)向"過(guò)程即體驗(yàn)"。
1.字節(jié)快手兩強(qiáng)并立,創(chuàng)業(yè)公司承壓突圍
字節(jié)跳動(dòng)的Seedance系列是愛(ài)詩(shī)不得不直面的頭號(hào)對(duì)手。
今年春節(jié)期間,Seedance 2.0爆火出圈,《黑神話:悟空》制作人馮驥給出"當(dāng)前地表最強(qiáng)"的評(píng)價(jià),更具殺傷力的是其商業(yè)化定價(jià)。
3月4日,字節(jié)跳動(dòng)火山引擎公布Seedance 2.0商業(yè)化定價(jià),生成一段15秒的標(biāo)準(zhǔn)視頻對(duì)應(yīng)成本15元,折合每秒1元。這一價(jià)格錨點(diǎn)意味著高保真視頻正在變成像水、電一樣可量化采購(gòu)的基礎(chǔ)服務(wù)。
字節(jié)的即夢(mèng)AI由剪映團(tuán)隊(duì)孵化,與剪映時(shí)間線及抖音、今日頭條等分發(fā)渠道深度打通,構(gòu)建起"模型+剪輯工具+分發(fā)場(chǎng)景"的完整閉環(huán)。
快手可靈則走通了另一條路。截至2025年7月,可靈全球用戶突破4500萬(wàn),累計(jì)生成超2億個(gè)視頻,服務(wù)超過(guò)2萬(wàn)家企業(yè)客戶,累計(jì)收入超1億元。
可靈支持生成1080p分辨率、最長(zhǎng)2分鐘的視頻,采用3D時(shí)空聯(lián)合注意力機(jī)制對(duì)物理規(guī)律進(jìn)行建模。其O1系列模型強(qiáng)調(diào)多模態(tài)理解和物理世界的仿真推演,試圖讓模型內(nèi)化重力、流體動(dòng)力學(xué)等規(guī)律。
快手借助可靈已經(jīng)建立起付費(fèi)心智,其會(huì)員體系為創(chuàng)作者提供了明確的商業(yè)化路徑。
面對(duì)這兩座大山,愛(ài)詩(shī)聯(lián)合創(chuàng)始人謝旭璋坦言有焦慮,但他表示,Seedance 2.0對(duì)愛(ài)詩(shī)的影響并不明顯,因?yàn)橐曨l生成的市場(chǎng)足夠大,大家還沒(méi)到需要正面競(jìng)爭(zhēng)的階段。
他強(qiáng)調(diào),愛(ài)詩(shī)的核心用戶是那些第一次用AI做視頻的普通人,而字節(jié)流量最大的視頻產(chǎn)品抖音主要還是做短視頻消費(fèi),兩者定位存在差異。
2.實(shí)時(shí)交互開(kāi)辟新戰(zhàn)場(chǎng),商業(yè)化驗(yàn)證成為分水嶺
視頻生成賽道的競(jìng)爭(zhēng)已從"能否生成"升級(jí)為"能否進(jìn)流程、進(jìn)交付"。核心指標(biāo)包括多鏡頭角色一致性、相機(jī)語(yǔ)法精確控制、角色復(fù)用性及音畫(huà)一體化成片能力。
AI視頻生成成本已降至約300美元/分鐘,相比傳統(tǒng)影視成本實(shí)現(xiàn)"數(shù)量級(jí)"下降,生產(chǎn)效率提升80%以上。成本的急劇降低催生了AI漫劇等新內(nèi)容形態(tài)的爆發(fā)。
愛(ài)詩(shī)的差異化打法在于押注"實(shí)時(shí)交互"。PixVerse R1采用Omni原生多模態(tài)架構(gòu),文字、圖像、音頻、視頻在同一Token流中聯(lián)合訓(xùn)練,使模型可理解跨模態(tài)物理關(guān)聯(lián)。
其自回歸機(jī)制確保每幀生成均參考?xì)v史內(nèi)容,支撐長(zhǎng)序列穩(wěn)定性;采樣步數(shù)壓縮至1-4步,通過(guò)冗余計(jì)算剔除與內(nèi)容感知型算力分配保障質(zhì)量與時(shí)效平衡。
實(shí)測(cè)中,R1可連續(xù)生成包含完整敘事流的視頻,鏡頭邏輯具備自主性,模型具備跨數(shù)十秒的長(zhǎng)期記憶能力。這一技術(shù)路徑將視頻從固定的線性播放,轉(zhuǎn)變?yōu)榭梢詫?shí)時(shí)反饋、動(dòng)態(tài)演變的連續(xù)可視化流,其想象空間延展至虛擬社交、沉浸式娛樂(lè)甚至生成式游戲。
但R1尚未完全滿足嚴(yán)格定義的世界模型標(biāo)準(zhǔn),測(cè)試中存在轉(zhuǎn)場(chǎng)跳接、角色形象偶現(xiàn)不穩(wěn)定等問(wèn)題,反映當(dāng)前角色綁定與物理規(guī)則建模仍待強(qiáng)化。
技術(shù)突破需要持續(xù)的算力投入,而這正是3億美元融資要解決的問(wèn)題。
從行業(yè)視角看,AI視頻的商業(yè)閉環(huán)正在確立。
天風(fēng)證券研報(bào)指出,AI漫劇行業(yè)已完成從0到1的商業(yè)驗(yàn)證,劇目數(shù)與廣告投放呈現(xiàn)跨越式增長(zhǎng)特征。
但硬幣的另一面是殘酷的淘汰賽,隨著Seedance 2.0等頂級(jí)模型的發(fā)布,平臺(tái)對(duì)內(nèi)容質(zhì)量的要求水漲船高,低質(zhì)內(nèi)容迅速失去生存空間。
對(duì)于愛(ài)詩(shī)來(lái)說(shuō),3億美元是它參與這場(chǎng)盛宴的資本。
但真正的考驗(yàn)在于,面對(duì)字節(jié)跳動(dòng)定下的"1元1秒"商業(yè)化標(biāo)尺,以及快手可靈在專業(yè)創(chuàng)作者心中建立的付費(fèi)心智,愛(ài)詩(shī)能否憑借實(shí)時(shí)交互的技術(shù)差異化和與中國(guó)儒意等產(chǎn)業(yè)方的場(chǎng)景協(xié)同,構(gòu)建起自己的護(hù)城河。
當(dāng)大廠把技術(shù)做成基礎(chǔ)設(shè)施,留給創(chuàng)業(yè)公司的容錯(cuò)空間已經(jīng)越來(lái)越窄。



