手机在线观看av,激情五月综合,色欧美日韩,五月婷中文,国产精品va免费视频,久久久成人综合亚洲欧洲精品,最初的梦想在线观看完整版未删减

每日經(jīng)濟(jì)新聞
要聞

每經(jīng)網(wǎng)首頁(yè) > 要聞 > 正文

對(duì)話智象未來(lái)CEO梅濤:AI公司的競(jìng)爭(zhēng),正從模型能力轉(zhuǎn)向產(chǎn)品能力與場(chǎng)景化落地

2026-05-20 20:45:48

每經(jīng)記者|可楊    每經(jīng)編輯|楊翼    

當(dāng)越來(lái)越多AI(人工智能)公司開(kāi)始將“世界模型”寫(xiě)入技術(shù)路線圖,視頻生成行業(yè)正經(jīng)歷新一輪升溫。

5月19日,在接受包括《每日經(jīng)濟(jì)新聞》記者在內(nèi)的媒體記者采訪時(shí),智象未來(lái)創(chuàng)始人、CEO(首席執(zhí)行官)梅濤反復(fù)強(qiáng)調(diào),當(dāng)前,行業(yè)距離真正意義上的世界模型還有很長(zhǎng)距離,“到今天為止,我們不會(huì)宣稱智象未來(lái)現(xiàn)在是一家世界模型公司。我認(rèn)為,市面上所有模型被稱作世界模型,說(shuō)實(shí)話還有點(diǎn)早”。

公開(kāi)資料顯示,智象未來(lái)是一家多模態(tài)生成式人工智能公司,成立于2023年,公司創(chuàng)始人、CEO梅濤是加拿大工程院外籍院士、原京東集團(tuán)副總裁。近日,智象未來(lái)宣布完成新一輪億元級(jí)融資,深創(chuàng)投、金浦投資等多家機(jī)構(gòu)參與。

在受訪過(guò)程中,梅濤圍繞視頻生成、原生全模態(tài)模型、具身智能與AI商業(yè)化等問(wèn)題,系統(tǒng)談及了他對(duì)行業(yè)技術(shù)路徑、創(chuàng)業(yè)公司機(jī)會(huì)以及AI產(chǎn)業(yè)分層的判斷。

在梅濤看來(lái),多模態(tài)生成技術(shù)遠(yuǎn)未收斂,而AI公司的競(jìng)爭(zhēng),也正在從模型能力轉(zhuǎn)向產(chǎn)品能力與場(chǎng)景化落地。

“世界模型不是只有一個(gè)模型”

過(guò)去一年,世界模型成為AI行業(yè)高頻詞,但在梅濤看來(lái),行業(yè)對(duì)于這一概念存在明顯誤讀。

“我發(fā)現(xiàn)很多人認(rèn)為世界模型是一個(gè)模型,其實(shí)這跟我們認(rèn)知的世界模型不太一樣。世界模型有不同路徑,將來(lái)也不是全世界只有一個(gè)模型,存在很多可能性?!泵窛赋?,真正的世界模型需要同時(shí)具備三類能力:對(duì)物理規(guī)律的理解與建模,對(duì)長(zhǎng)上下文因果關(guān)系的處理,以及與物理世界的多模態(tài)感知交互能力,包括觸覺(jué)、關(guān)節(jié)點(diǎn)運(yùn)動(dòng)、三維空間自由度等?!拔覀儽仨殞?duì)世界模型的定義、世界模型的場(chǎng)景和科學(xué)規(guī)律保持一種敬畏之心。”

梅濤用一個(gè)具體場(chǎng)景來(lái)說(shuō)明當(dāng)前的差距:讓一個(gè)機(jī)器人走進(jìn)房間,知道主人喜歡喝茶還是咖啡,然后完成取瓶、擰蓋、倒水、送杯這一系列動(dòng)作?!敖裉斓臋C(jī)器人,離這個(gè)還很遙遠(yuǎn)?!?/p>

安全性,即在真實(shí)場(chǎng)景的穩(wěn)定運(yùn)營(yíng),也是梅濤強(qiáng)調(diào)的現(xiàn)實(shí)障礙之一。梅濤認(rèn)為,機(jī)器人如果在工廠或家里運(yùn)作,目前需要很強(qiáng)的安全保障。如果安全性不是百分之百,就像自動(dòng)駕駛一樣,“進(jìn)家里怎么保證人身安全、怎么保證不損壞貴重物品,還需要相當(dāng)長(zhǎng)的時(shí)間”。

對(duì)于通往世界模型的路徑,梅濤的判斷是,目前世界模型的架構(gòu)尚不明朗,未來(lái)可能并非只有一家公司來(lái)承擔(dān),不同公司會(huì)在各自的垂直場(chǎng)景中做出相對(duì)通用但實(shí)際上高度專用化的模型,“會(huì)開(kāi)車的,會(huì)撿東西的,會(huì)跑步的機(jī)器人,應(yīng)該都是非常垂直的模型”。

“將來(lái)通往世界模型的路上,每個(gè)公司說(shuō)自己是世界模型,我也能接受。但每個(gè)人不會(huì)做特別通用的事情?!泵窛a(bǔ)充道。

對(duì)于具身智能領(lǐng)域與視頻模型的關(guān)系,梅濤曾公開(kāi)表示,“很多具身智能公司低估了視頻模型的重要性”。

梅濤指出,當(dāng)前,具身智能公司普遍采用的模型參數(shù)量“大概幾十億,不超過(guò)100億”,而這個(gè)量級(jí)遠(yuǎn)不足以支撐復(fù)雜場(chǎng)景下的泛化能力。

“如果真要做到世界模型,你要干很多活,怎么可能是一個(gè)小模型就能搞定?怎么可能采一些數(shù)據(jù)就能做到符合要求?”梅濤認(rèn)為,沒(méi)有足夠厚的底座模型,具身智能很難真正實(shí)現(xiàn)泛化。

“多模態(tài)生成領(lǐng)域技術(shù)尚未收斂”

對(duì)于當(dāng)前的技術(shù)路徑演進(jìn),梅濤認(rèn)為,多模態(tài)生成領(lǐng)域技術(shù)尚未收斂,“這是創(chuàng)業(yè)公司的機(jī)會(huì)。如果技術(shù)完全收斂,統(tǒng)一采用DiT框架,我們也不用做了,因?yàn)楦刹贿^(guò)大廠”。

公開(kāi)資料顯示,DiT架構(gòu),全稱Diffusion Transformer,是一種將Transformer架構(gòu)作為骨干網(wǎng)絡(luò)應(yīng)用于擴(kuò)散模型的生成式人工智能架構(gòu),主要用于圖像和視頻生成任務(wù)。

“算法、數(shù)據(jù)、算力,三個(gè)都重要?!痹诿窛磥?lái),當(dāng)算法框架固定之后,數(shù)據(jù)和算力的重要性才會(huì)上升,競(jìng)爭(zhēng)才會(huì)真正變成資源的比拼。但當(dāng)算法出現(xiàn)新的突破,既有的數(shù)據(jù)積累優(yōu)勢(shì)會(huì)被部分稀釋。這意味著,只要技術(shù)路線尚未確定,就仍然存在以算法創(chuàng)新?lián)Q取相對(duì)優(yōu)勢(shì)的空間?!叭绻坏┧惴ê图軜?gòu)發(fā)生了變化,或者有新的架構(gòu)與新算法出現(xiàn)后,數(shù)據(jù)的重要性會(huì)有所降低。”

對(duì)于當(dāng)前視頻生成領(lǐng)域的競(jìng)爭(zhēng)格局,梅濤將其分為三層:擁有流量入口的平臺(tái)型企業(yè);做底層基座大模型的公司;以及大量做Agent(智能體)和行業(yè)應(yīng)用的公司。

梅濤表示,智象未來(lái)在第二層和第三層之間布局,既打造特色差異化模型,也開(kāi)展行業(yè)應(yīng)用,智象未來(lái)不與大型模型廠商正面比拼底座模型,該領(lǐng)域投入成本極高。基于當(dāng)前體量,公司選擇聚焦特色領(lǐng)域,例如基于全新一代原生全模態(tài)架構(gòu)Unified Transformer(UiT)打造的圖像生成模型HiDream-O1-Image。其次,在視頻生成領(lǐng)域則做與商業(yè)場(chǎng)景緊密相關(guān)的內(nèi)容,例如商業(yè)營(yíng)銷、影視創(chuàng)作等垂類場(chǎng)景應(yīng)用的視頻生成模型。

梅濤認(rèn)為,大模型提供的原子能力不等于最終產(chǎn)品體驗(yàn)。用戶,尤其是非開(kāi)發(fā)者,無(wú)法直接調(diào)用模型接口,中間必須存在一個(gè)由API、技能封裝再到智能體構(gòu)成的中間層。

梅濤進(jìn)一步將AI公司的商業(yè)價(jià)值分為三層:最底層是算力價(jià)值(芯片、基建等),中間層是Token(詞元)價(jià)值;“大模型的費(fèi)用,長(zhǎng)線來(lái)看一定是水電、一定是基建,價(jià)格會(huì)非常公開(kāi)、非常透明,也會(huì)越來(lái)越便宜;最上層是應(yīng)用落地帶來(lái)的商業(yè)價(jià)值,這取決于公司的商業(yè)模式。”梅濤認(rèn)為,創(chuàng)業(yè)公司若只賣平臺(tái)或Token,無(wú)法與大廠比拼資源與流量,必須把應(yīng)用層做厚,與客戶共創(chuàng)價(jià)值,才能在競(jìng)爭(zhēng)中建立壁壘。

對(duì)于創(chuàng)業(yè)公司與大廠的競(jìng)爭(zhēng),梅濤表示,大廠不可能覆蓋每個(gè)角落。“現(xiàn)在,沒(méi)有一家模型公司能夠滿足客戶的所有需求,這是行業(yè)共識(shí)?!?/p>

對(duì)于智象未來(lái)自身的定位,梅濤表示,公司長(zhǎng)期目標(biāo)是探索并構(gòu)建世界模型,但在當(dāng)下,智象未來(lái)更嚴(yán)謹(jǐn)?shù)貙⒆约憾x為一家原生多模態(tài)大模型公司,在邁向世界模型的過(guò)程中還是會(huì)先聚焦在圖像、視頻、3D交互這些多模態(tài)數(shù)據(jù)的生成、理解與建模上。

梅濤認(rèn)為,原生多模態(tài)一定會(huì)通往世界模型,但中間還有很長(zhǎng)的路。“世界模型一定有清晰定義,包括其能力邊界、技術(shù)內(nèi)涵和應(yīng)用目標(biāo)。否則,相關(guān)討論容易停留在概念層面,不加定義的話說(shuō)得不好聽(tīng)就是‘耍流氓’,難以指向一個(gè)具備統(tǒng)一認(rèn)知和構(gòu)建能力的世界模型?!?/p>

封面圖片來(lái)源:每經(jīng)媒資庫(kù)

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

1

0