手机在线观看av,激情五月综合,色欧美日韩,五月婷中文,国产精品va免费视频,久久久成人综合亚洲欧洲精品,最初的梦想在线观看完整版未删减

每日經濟新聞
要聞

每經網首頁 > 要聞 > 正文

漲十周后連降兩周!全球AI大模型Token調用量遭遇逆轉,誰在為AI算力漲價買單?

每日經濟新聞 2026-04-21 15:49:41

每經記者|宋欣悅    每經編輯|金冥羽 楊軍    

記者|宋欣悅

編輯|金冥羽?楊軍?杜波?校對|張錦河

連漲十周之后,全球AI大模型的Token(詞元)調用量踩了剎車。

《每日經濟新聞》記者根據(jù)OpenRouter(目前全球最大AI模型API聚合平臺,擁有超500萬開發(fā)者用戶,其API調用量數(shù)據(jù)被業(yè)界視為AI應用落地的“晴雨表”)最新數(shù)據(jù)測算,上周(4月13日至19日)全球AI大模型總調用量為20.6萬億Token,連續(xù)兩周走低。

值得注意的是,上榜的AI大模型中,中國AI大模型周調用量環(huán)比下跌23.77%至4.44萬億Token,而美國AI大模型周調用量環(huán)比增長20.62%至4.91萬億Token,近兩個月來首次反超。這場逆轉,與一輪席卷全球的算力漲價潮高度吻合。

轉折點源于全球性算力成本上漲

記者根據(jù)OpenRouter最新數(shù)據(jù)測算,上周全球AI大模型總調用量為20.6萬億Token,連漲十周后,連續(xù)兩周走低。其中,上榜的AI大模型中,中國AI大模型周調用量下滑至4.44萬億Token,較此前一周下滑23.77%;美國AI大模型周調用量為4.91萬億Token,環(huán)比增長20.62%,近兩個月來首次超越中國。

GXaOuDJovOqiaVLVTNbmU35v6URVoib3H8qnWyq2sHn2DJD85OBhmEDVib8XtaCPD6UUia5tcGDibTAB8mwaVAOznGulxQrIbM0uqxuKFRCOUuI0.png

全球調用量從連漲十周到轉頭向下,轉折點源于全球性的算力成本上漲。自3月以來,以阿里云、騰訊、百度為代表的云廠商相繼上調大模型相關服務價格。

4月8日,智譜發(fā)布GLM-5.1的同時,再度提價10%,從而完成今年第三次調價。調價后,GLM-5.1在Coding編程場景的緩存命中Token價格,已接近Anthropic旗下Claude Sonnet 4.6水平,標志著國產大模型首次在核心應用場景實現(xiàn)與海外領先者的價格對齊。

海外AI巨頭Anthropic同樣調整了定價策略,將旗下企業(yè)級產品Claude Enterprise的訂閱模式從“每月每用戶最高200美元固定費用”改為“按實際算力消耗計費,另加每月20美元固定費”。

這意味著,輕度用戶月費可能有所下降,但重度用戶反而更貴。軟件授權談判協(xié)助公司Redress Compliance聯(lián)合創(chuàng)始人Fredrik Filipsson表示,新定價可能導致重度用戶成本翻倍甚至三倍。

國產模型“產品力”迎大考

“Token資費普遍上漲,成本增高,用戶不得不控制總量節(jié)約成本?!鄙虾X斀洿髮W特聘教授胡延平告訴《每日經濟新聞》記者,當價格優(yōu)勢不再突出,模型的產品力便成為左右用戶選擇的關鍵。

胡延平分析,上周美國AI大模型調用量回升,主要由Anthropic旗下Claude Sonnet和Opus模型拉動。這兩款模型已成為編程(Coding)領域的“硬通貨”,而國產大模型在這方面的產品力仍需提升。

OpenRouter數(shù)據(jù)顯示,上周,Claude Sonnet 4.6沖上榜首,周調用量達1.38萬億Token,環(huán)比增長19%;Claude Opus 4.6位居第三,周調用量達1.22萬億Token。兩款模型合計占美國AI大模型周調用量逾五成。

GXaOuDJovOqf8TKEhMlYhicZ6sIB7hEVribCxnVzu1sG574xXTITbqEqRnSpTpDLJkoSgILkmJGq5Nv6w0yscYn1Ov7yg8icl8KreXxTjyUfWw.png

與此形成對比的,是近期國產模型的“過山車”行情。

在此前一周(4月6日至12日),阿里Qwen3.6 Plus以1.66萬億Token的周調用量居全球榜首,但僅過一周(4月13日至19日)便下滑出榜單。

此外,記者注意到,此前多次上榜的Kimi K2.5、智譜GLM系列模型,已連續(xù)三周未登榜;此前一度沖上榜單第二的階躍星辰Step 3.5 Flash,近兩周同樣無緣榜單。

胡延平認為,OpenRouter平臺的用戶以開發(fā)者和中小企業(yè)為主,對模型迭代能力和垂直場景產品力要求極高?!笆袌鲇脩粲型^部主力模型集中的趨向,在能夠觸達的范圍內,用戶只用最好的?!彼赋?,用戶場景越來越要求模型具備強工具調用能力、多Agent支持、長程復雜任務的持續(xù)達成能力,“目前OpenRouter上的大部分模型在這方面還需著力提升”。

有業(yè)內人士也向《每日經濟新聞》記者指出,算力成本上漲后,行業(yè)內普遍優(yōu)先選擇性能穩(wěn)定、輸出效果可靠的工具,價格已非首要考量。

專家:全球消耗量仍處快速增長通道

短期數(shù)據(jù)波動,是否意味著AI應用熱潮正在消退?

“短期還不宜下結論?!焙悠教嵝?,OpenRouter的Token調用量僅占全球消耗總量的約2%~4%,其排名波動更多反映的是開源、二線及新發(fā)模型的競爭態(tài)勢,不能代表整個市場的走向。

事實上,成本壓力正在倒逼市場進化。胡延平觀察到,今年初以來,OpenClaw等各類智能體、多Agent應用已將Token調用量拉升至去年底的兩三倍水平;成本大幅抬高,促使企業(yè)和用戶轉而采用記憶優(yōu)化、提示詞壓縮、Harness Engineering(約束工程)等手段主動降耗。

記者了解到,甚至有中小創(chuàng)業(yè)者已將Token使用量納入員工績效考核。市場正從單純追求數(shù)量的“堆量”階段,進化到追求更高投入產出比的“提效”階段。

更深層的變化,在于AI應用場景本身的質變。國聯(lián)民生證券一份研報中提出“Token通脹”的概念。這并非指Token本身變貴,而是指單位時間內、單位用戶的Token消耗結構性上升。

用戶的需求正從淺層的“問答”轉向深度的“干活”。Token不是傳統(tǒng)互聯(lián)網時代邊際成本幾乎為零的“流量”,而是執(zhí)行生產任務時必不可少的“燃料”。

摩根大通在研報中對中國市場作出極為樂觀的預測,預計2025年至2030年,中國Token消耗量的年復合增長率將達330%,5年內將實現(xiàn)370倍增長。

胡延平同樣對長期趨勢保持堅定樂觀:“就中長期而言,無論OpenRouter上的統(tǒng)計數(shù)據(jù)如何波動,包括中國在內,全球Token消耗總量都處在快速增長通道,未來兩三年會有數(shù)十倍甚至數(shù)百倍的增加?!?/span>

眼下的調用量下滑,或許只是價格沖擊下的一次短暫換倉。真正的問題不是AI熱潮是否消退,而是當Token從“免費試用”走向“真實定價”,誰的模型經得起市場用真金白銀來投票。

CFF20LXzkOyYmal29zn37N5Bg2NQ4tyN4ylvMFyM3VmF4x90Uj4cDmoEphibia4RN55ibIXmqU1Od9w2Q5nhA08lA.png

每日經濟新聞 ?nbdnews? 原創(chuàng)文章

未經許可禁止轉載、摘編、復制及鏡像等使用

如需轉載請與《每日經濟新聞》報社聯(lián)系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

歡迎關注每日經濟新聞APP

每經經濟新聞官方APP

0

0