要聞

對(duì)話智象未來(lái)CEO梅濤：AI公司的競(jìng)爭(zhēng)，正從模型能力轉(zhuǎn)向產(chǎn)品能力與場(chǎng)景化落地

2026-05-20 20:45:48

每經(jīng)記者｜可楊每經(jīng)編輯｜楊翼

當(dāng)越來(lái)越多AI（人工智能）公司開(kāi)始將“世界模型”寫(xiě)入技術(shù)路線圖，視頻生成行業(yè)正經(jīng)歷新一輪升溫。

5月19日，在接受包括《每日經(jīng)濟(jì)新聞》記者在內(nèi)的媒體記者采訪時(shí)，智象未來(lái)創(chuàng)始人、CEO（首席執(zhí)行官）梅濤反復(fù)強(qiáng)調(diào)，當(dāng)前，行業(yè)距離真正意義上的世界模型還有很長(zhǎng)距離，“到今天為止，我們不會(huì)宣稱智象未來(lái)現(xiàn)在是一家世界模型公司。我認(rèn)為，市面上所有模型被稱作世界模型，說(shuō)實(shí)話還有點(diǎn)早”。

公開(kāi)資料顯示，智象未來(lái)是一家多模態(tài)生成式人工智能公司，成立于2023年，公司創(chuàng)始人、CEO梅濤是加拿大工程院外籍院士、原京東集團(tuán)副總裁。近日，智象未來(lái)宣布完成新一輪億元級(jí)融資，深創(chuàng)投、金浦投資等多家機(jī)構(gòu)參與。

在受訪過(guò)程中，梅濤圍繞視頻生成、原生全模態(tài)模型、具身智能與AI商業(yè)化等問(wèn)題，系統(tǒng)談及了他對(duì)行業(yè)技術(shù)路徑、創(chuàng)業(yè)公司機(jī)會(huì)以及AI產(chǎn)業(yè)分層的判斷。

在梅濤看來(lái)，多模態(tài)生成技術(shù)遠(yuǎn)未收斂，而AI公司的競(jìng)爭(zhēng)，也正在從模型能力轉(zhuǎn)向產(chǎn)品能力與場(chǎng)景化落地。

“世界模型不是只有一個(gè)模型”

過(guò)去一年，世界模型成為AI行業(yè)高頻詞，但在梅濤看來(lái)，行業(yè)對(duì)于這一概念存在明顯誤讀。

“我發(fā)現(xiàn)很多人認(rèn)為世界模型是一個(gè)模型，其實(shí)這跟我們認(rèn)知的世界模型不太一樣。世界模型有不同路徑，將來(lái)也不是全世界只有一個(gè)模型，存在很多可能性?！泵窛赋?，真正的世界模型需要同時(shí)具備三類能力：對(duì)物理規(guī)律的理解與建模，對(duì)長(zhǎng)上下文因果關(guān)系的處理，以及與物理世界的多模態(tài)感知交互能力，包括觸覺(jué)、關(guān)節(jié)點(diǎn)運(yùn)動(dòng)、三維空間自由度等?！拔覀儽仨殞?duì)世界模型的定義、世界模型的場(chǎng)景和科學(xué)規(guī)律保持一種敬畏之心。”

梅濤用一個(gè)具體場(chǎng)景來(lái)說(shuō)明當(dāng)前的差距：讓一個(gè)機(jī)器人走進(jìn)房間，知道主人喜歡喝茶還是咖啡，然后完成取瓶、擰蓋、倒水、送杯這一系列動(dòng)作?！敖裉斓臋C(jī)器人，離這個(gè)還很遙遠(yuǎn)?！?/p>

安全性，即在真實(shí)場(chǎng)景的穩(wěn)定運(yùn)營(yíng)，也是梅濤強(qiáng)調(diào)的現(xiàn)實(shí)障礙之一。梅濤認(rèn)為，機(jī)器人如果在工廠或家里運(yùn)作，目前需要很強(qiáng)的安全保障。如果安全性不是百分之百，就像自動(dòng)駕駛一樣，“進(jìn)家里怎么保證人身安全、怎么保證不損壞貴重物品，還需要相當(dāng)長(zhǎng)的時(shí)間”。

對(duì)于通往世界模型的路徑，梅濤的判斷是，目前世界模型的架構(gòu)尚不明朗，未來(lái)可能并非只有一家公司來(lái)承擔(dān)，不同公司會(huì)在各自的垂直場(chǎng)景中做出相對(duì)通用但實(shí)際上高度專用化的模型，“會(huì)開(kāi)車的，會(huì)撿東西的，會(huì)跑步的機(jī)器人，應(yīng)該都是非常垂直的模型”。

“將來(lái)通往世界模型的路上，每個(gè)公司說(shuō)自己是世界模型，我也能接受。但每個(gè)人不會(huì)做特別通用的事情?！泵窛a(bǔ)充道。

對(duì)于具身智能領(lǐng)域與視頻模型的關(guān)系，梅濤曾公開(kāi)表示，“很多具身智能公司低估了視頻模型的重要性”。

梅濤指出，當(dāng)前，具身智能公司普遍采用的模型參數(shù)量“大概幾十億，不超過(guò)100億”，而這個(gè)量級(jí)遠(yuǎn)不足以支撐復(fù)雜場(chǎng)景下的泛化能力。

“如果真要做到世界模型，你要干很多活，怎么可能是一個(gè)小模型就能搞定？怎么可能采一些數(shù)據(jù)就能做到符合要求？”梅濤認(rèn)為，沒(méi)有足夠厚的底座模型，具身智能很難真正實(shí)現(xiàn)泛化。

“多模態(tài)生成領(lǐng)域技術(shù)尚未收斂”

對(duì)于當(dāng)前的技術(shù)路徑演進(jìn)，梅濤認(rèn)為，多模態(tài)生成領(lǐng)域技術(shù)尚未收斂，“這是創(chuàng)業(yè)公司的機(jī)會(huì)。如果技術(shù)完全收斂，統(tǒng)一采用DiT框架，我們也不用做了，因?yàn)楦刹贿^(guò)大廠”。

公開(kāi)資料顯示，DiT架構(gòu)，全稱Diffusion Transformer，是一種將Transformer架構(gòu)作為骨干網(wǎng)絡(luò)應(yīng)用于擴(kuò)散模型的生成式人工智能架構(gòu)，主要用于圖像和視頻生成任務(wù)。

“算法、數(shù)據(jù)、算力，三個(gè)都重要?！痹诿窛磥?lái)，當(dāng)算法框架固定之后，數(shù)據(jù)和算力的重要性才會(huì)上升，競(jìng)爭(zhēng)才會(huì)真正變成資源的比拼。但當(dāng)算法出現(xiàn)新的突破，既有的數(shù)據(jù)積累優(yōu)勢(shì)會(huì)被部分稀釋。這意味著，只要技術(shù)路線尚未確定，就仍然存在以算法創(chuàng)新?lián)Q取相對(duì)優(yōu)勢(shì)的空間?！叭绻坏┧惴ê图軜?gòu)發(fā)生了變化，或者有新的架構(gòu)與新算法出現(xiàn)后，數(shù)據(jù)的重要性會(huì)有所降低。”

對(duì)于當(dāng)前視頻生成領(lǐng)域的競(jìng)爭(zhēng)格局，梅濤將其分為三層：擁有流量入口的平臺(tái)型企業(yè)；做底層基座大模型的公司；以及大量做Agent（智能體）和行業(yè)應(yīng)用的公司。

梅濤表示，智象未來(lái)在第二層和第三層之間布局，既打造特色差異化模型，也開(kāi)展行業(yè)應(yīng)用，智象未來(lái)不與大型模型廠商正面比拼底座模型，該領(lǐng)域投入成本極高。基于當(dāng)前體量，公司選擇聚焦特色領(lǐng)域，例如基于全新一代原生全模態(tài)架構(gòu)Unified Transformer（UiT）打造的圖像生成模型HiDream-O1-Image。其次，在視頻生成領(lǐng)域則做與商業(yè)場(chǎng)景緊密相關(guān)的內(nèi)容，例如商業(yè)營(yíng)銷、影視創(chuàng)作等垂類場(chǎng)景應(yīng)用的視頻生成模型。

梅濤認(rèn)為，大模型提供的原子能力不等于最終產(chǎn)品體驗(yàn)。用戶，尤其是非開(kāi)發(fā)者，無(wú)法直接調(diào)用模型接口，中間必須存在一個(gè)由API、技能封裝再到智能體構(gòu)成的中間層。

梅濤進(jìn)一步將AI公司的商業(yè)價(jià)值分為三層：最底層是算力價(jià)值（芯片、基建等），中間層是Token（詞元）價(jià)值；“大模型的費(fèi)用，長(zhǎng)線來(lái)看一定是水電、一定是基建，價(jià)格會(huì)非常公開(kāi)、非常透明，也會(huì)越來(lái)越便宜；最上層是應(yīng)用落地帶來(lái)的商業(yè)價(jià)值，這取決于公司的商業(yè)模式。”梅濤認(rèn)為，創(chuàng)業(yè)公司若只賣平臺(tái)或Token，無(wú)法與大廠比拼資源與流量，必須把應(yīng)用層做厚，與客戶共創(chuàng)價(jià)值，才能在競(jìng)爭(zhēng)中建立壁壘。

對(duì)于創(chuàng)業(yè)公司與大廠的競(jìng)爭(zhēng)，梅濤表示，大廠不可能覆蓋每個(gè)角落。“現(xiàn)在，沒(méi)有一家模型公司能夠滿足客戶的所有需求，這是行業(yè)共識(shí)?！?/p>

對(duì)于智象未來(lái)自身的定位，梅濤表示，公司長(zhǎng)期目標(biāo)是探索并構(gòu)建世界模型，但在當(dāng)下，智象未來(lái)更嚴(yán)謹(jǐn)?shù)貙⒆约憾x為一家原生多模態(tài)大模型公司，在邁向世界模型的過(guò)程中還是會(huì)先聚焦在圖像、視頻、3D交互這些多模態(tài)數(shù)據(jù)的生成、理解與建模上。

梅濤認(rèn)為，原生多模態(tài)一定會(huì)通往世界模型，但中間還有很長(zhǎng)的路。“世界模型一定有清晰定義，包括其能力邊界、技術(shù)內(nèi)涵和應(yīng)用目標(biāo)。否則，相關(guān)討論容易停留在概念層面，不加定義的話說(shuō)得不好聽(tīng)就是‘耍流氓’，難以指向一個(gè)具備統(tǒng)一認(rèn)知和構(gòu)建能力的世界模型?！?/p>

封面圖片來(lái)源：每經(jīng)媒資庫(kù)

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán)，嚴(yán)禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

上一篇文章

5月21日汽車市場(chǎng)熱點(diǎn)

返回每經(jīng)網(wǎng)首頁(yè)

下一篇文章

普京對(duì)習(xí)近平說(shuō)：親愛(ài)的朋友，一日不見(jiàn)，如隔三秋

相關(guān)文章