(網(wǎng)經(jīng)社訊)12月3日,中國科技產(chǎn)業(yè)智庫「甲子光年」在北京·萬達文華酒店舉辦「2025甲子引力年終盛典」。甲子光年創(chuàng)始人&CEO張一甲重磅發(fā)布主題報告《轟然成勢 萬象歸一:2025人工智能產(chǎn)業(yè)30條判斷》。以下為報告詳細內(nèi)容。
1.過去一年,AI發(fā)生了什么?
2.此刻:轟然成勢,萬象歸一
2.1轟然成勢,萬象歸一
今年的主題是“轟然成勢,萬象歸一”,我先解釋一下為什么用這八個字作為主題。
如果一個人在十年前沉入夢鄉(xiāng),今天剛剛蘇醒,他或許會覺得人工智能是一個憑空降臨的龐然大物。
一覺醒來,仿佛世界被重新編碼。它無處不在:能寫文章、能編曲、能設(shè)計、能編程,在企業(yè)中排班,在工廠里檢測,在課堂上教學(xué),在醫(yī)院里診斷……仿佛這股力量,是在他沉睡的這些年里突兀而神秘地橫空出世。AI已經(jīng)“轟然成勢”。閾值已至,其勢已成。
何為“勢”?
勢,不是單一參數(shù)的線性增長,而是復(fù)雜系統(tǒng)的能量耦合,多股力量同頻共振,將我們推過一個無可逆轉(zhuǎn)的臨界點。勢也并非憑空而來,它是長期積蓄后的“轟然顯形”,就像地震前的地殼運動——緩慢而堅決,某一刻地表的震動,只是深層能量早已堆積的結(jié)果。
從“算法可行”到“系統(tǒng)成勢”,這一路,是時間的壓強,也是集體意志的匯聚。
何為“萬象歸一”?
“歸一”不是指一切被統(tǒng)一為單一,不是消弭多樣性,而是對復(fù)雜性的更高維組織——在全新的經(jīng)濟形態(tài)里,我們開始共享一種新的底層邏輯。
模型、算力、數(shù)據(jù)、應(yīng)用,正融合為統(tǒng)一的經(jīng)濟基礎(chǔ);千行百業(yè)的痛點,正在“智能”這一命題下找到共解;政策、資本、產(chǎn)業(yè)與社會接受度,也必須形成新的協(xié)同。
2.2“轟然成勢”,是能量的臨界;“萬象歸一”,是秩序的自覺
“轟然成勢”,是能量的臨界;“萬象歸一”,是秩序的自覺。
“轟然成勢,萬象歸一”八個字,蘊含著智能革命從爆發(fā)到秩序的底層邏輯。
3.定義:“默認式AI(Default AI)”
3.1概念定義:默認式AI(Default AI)
這個底層邏輯是什么?
甲子光年將其定義為:默認式AI。
“默認式AI”(Default AI):無需用戶主動選擇或感知,默認存在、默認開啟的人工智能形態(tài)。
——甲子光年
經(jīng)歷了數(shù)年的爆發(fā)與重構(gòu),AI從“技術(shù)的奇觀”成為了“默認的存在”。它不再是實驗室里的驚嘆,而是社會的結(jié)構(gòu),是經(jīng)濟系統(tǒng)的沉默底層。它不是“被使用的AI”,而是“自然而然存在的AI”。
3.2默認即智能:智能成為常態(tài),AI走向日用而不覺
2023年我們感受到的AI是驚訝、嘗鮮;2024年我們感受到的AI是商業(yè)的拷問;2025年我們感受到的AI是一種“默認”——默認即智能:智能成為常態(tài),AI走向日用而不覺。
如果我們打開一個網(wǎng)頁,沒有AI,你會覺得很奇怪;如果你的一位朋友沒有使用過AI,你會覺得很反常。
數(shù)據(jù)顯示:超過一半的美國成年人(61%)在過去六個月中使用過人工智能,近五分之一的人每天都依賴人工智能。
3.3默認式AI特征:關(guān)閉才是例外,不用才是例外,不會才是例外
“默認式AI”具有三大特征:
1.非選擇性(Non-optional):用戶不再“決定是否使用AI”,而是在日常操作中自動與AI交互。例如:輸入框默認AI補全、相機默認AI識別、搜索結(jié)果默認AI重寫。
2.低感知(Invisible):AI的參與被隱形化和底層化,用戶甚至不察覺AI在起作用。例如:iPhone照片自動分類、郵件的智能排序、文檔自動摘要。
3.系統(tǒng)綁定(System-integrated):AI不以獨立應(yīng)用的形式存在,而是嵌入操作系統(tǒng)、平臺或設(shè)備的基礎(chǔ)層。例如:Windows Copilot、Apple Intelligence。
3.4AI社會化三階段:工具式AI→伴隨式AI→默認式AI
默認式AI(Default AI)是人工智能社會化演進的第三階段。
階段1:工具式AI(Tool AI)——AI是“被使用的能力”,強調(diào)“我在用AI”。
階段2:伴隨式AI(Assistive AI)——AI是“共同工作的伙伴”,強調(diào)“AI在幫我”。
階段3:默認式AI(Default AI)——AI是“世界的底層邏輯”,強調(diào)“AI就在那兒”。
當一項技術(shù)成為“默認式”的,意味著它已經(jīng)深度嵌入社會結(jié)構(gòu),具備了不可逆性——即使后續(xù)技術(shù)路線更迭,甚至經(jīng)歷商業(yè)泡沫,但這個時代依然開啟了——就像互聯(lián)網(wǎng)曲曲折折,也經(jīng)歷過互聯(lián)網(wǎng)泡沫,但互聯(lián)網(wǎng)時代依然不可逆地繼續(xù)推進著。
今天來看,AI也進入了這樣一個時代。它從“被使用”變?yōu)椤氨活A(yù)設(shè)”,成為了所有人的戰(zhàn)略前置。剛才所說,“轟然成勢,萬象歸一”,而“默認式AI”,正是這個“一”的內(nèi)涵。
接下來,我們看具體的判斷。
關(guān)注公眾號「甲子光年」,后臺回復(fù)“轟然成勢”,獲得高清版完整PDF?;蛘唿c擊文末“閱讀原文”,進入甲子光年官網(wǎng)下載。
4.2025年全球人工智能發(fā)展趨勢30條判斷
4.1技術(shù)趨勢
【判斷1】“智能基線”的提升:仍是AI本質(zhì)驅(qū)動力,AI正在九個維度變得更強
2025年,可能很多人有一種直觀感覺,業(yè)界議題大比例地聊AI應(yīng)用、AI落地,但第一個判斷首先我們還是想強調(diào)一點——智能本身的提升。
智能的基線決定了“AI能做到什么”。沒有更強的推理、記憶、理解能力,Agent只是更精巧的流程圖。所以,我們依然需要“更高一級的智能”。
OECD(經(jīng)合組織)在2025年發(fā)布了AI能力指標:用九個維度描述了當前AI的能力進階,包括語言能力,社會互動能力,問題解決能力,創(chuàng)造力,元認知與批判性思維,知識、學(xué)習(xí)與記憶能力,視覺能力,操作能力以及機器人智能。這些維度共同定義了“智能本身”的基線。
如圖所示,2025年,圍繞這些維度,各個前沿模型不僅沒有停滯迭代,還在強勁地進步,且競爭比任何時候都更加激烈——智能這件事本身還遠未到天花板。
【判斷2】Beyond Transformer:“架構(gòu)級”探索仍在繼續(xù),但仍未撼動Transformer地位
在大模型研發(fā)的最核心層——架構(gòu)層,仍然存在關(guān)鍵變量。
Transformer依舊是當下的絕對主流:幾乎所有最強通用模型仍基于Transformer或其變體。但隨著應(yīng)用規(guī)模放大,它的短板也被放大:比如算力成本、推理效率和存儲瓶頸。
為解決這些問題,人們在不同的路徑上探索:一方面,Transformer路線本身在持續(xù)進化,另一方面,非Transformer架構(gòu)也在同步發(fā)展。如今,兩條路線也正在融合,走向混合架構(gòu)。
路線分化的內(nèi)在邏輯是,Transformer路線更多追求的是“智能的上限”,非Transformer路線追求的是“智能的效率”——在提供同等性能的同時,把計算復(fù)雜度降低為線性復(fù)雜度,在可承受成本內(nèi)把智能鋪到更多場景和終端。兩條路線正對應(yīng)甲子光年智庫之前提及的AI的“進擊”和“普惠”兩個方向。
例如,RockAI為非Transformer國產(chǎn)化的表率,率先推出中國自主架構(gòu)大模型,且在PC、平板、機器人、樹莓派等終端上率先落地。RockAI以“讓世界上每一臺設(shè)備擁有自己的智能”為使命,于2024年1月發(fā)布國內(nèi)首個非Transformer架構(gòu)大模型Yan 1.0,2025年7月發(fā)布全球首個擁有原生記憶力的大模型Yan 2.0 Preview。
2025年,AI模型架構(gòu)正在“Beyond Transformer”,但尚未“After Transformer”,transformer仍未被“機制級”顛覆。但最值得期待的創(chuàng)新,恰恰是跳出路徑依賴、改寫規(guī)則的創(chuàng)新——如果“After Transformer”最終形成,它可能已經(jīng)在今天展現(xiàn)出了雛形。
【判斷3】智能與智能體互相鍛造:智能賦予行動以可能,行動回饋智能以演化
智能(intelligence)與智能體(agent),絕不僅僅是“大腦+行動”的簡單分工,更好的比喻是“生成器”與“校驗器”——它們互為條件、互相鍛造,在遞歸循環(huán)中共同走向更高階的復(fù)雜性與通用性。
第一,基模的智能,直接決定智能體的上限與可靠性。
有了智能,agent才獲得“想象能力”——比如“如果我在狀態(tài)s采取動作a,期望回報會是什么”,這讓智能體能在多個備選動作之間做權(quán)衡,可能性空間因此被打開,這正是目標導(dǎo)向和自主性的根源。
第二,智能體又反過來鍛造智能本身。
基礎(chǔ)模型的優(yōu)化,并不是關(guān)起門來訓(xùn)練,而是不斷從智能體與環(huán)境的交互中形成“任務(wù)執(zhí)行→行為結(jié)果→數(shù)據(jù)回流→基模迭代→能力躍遷”的正循環(huán)。
智能體構(gòu)成“外環(huán)”,智能是“內(nèi)環(huán)”。外環(huán)的實踐不僅修正自己的動作,還能回灌到智能系統(tǒng),修正內(nèi)環(huán)的規(guī)則本身。我們不能低估了這種“回灌”——科學(xué)史上的實驗反常倒逼理論革命就是這條回路的體現(xiàn)。
第三,多智能體協(xié)作,提供了“智能體反哺智能”的一個視角。
來自清華的一項研究觀察到了“協(xié)作縮放定律”:大模型不只是“單體變大”可以遵循scaling law,“多智能體的協(xié)作”本身也有一條scaling law——當多智能體通過特定結(jié)構(gòu)協(xié)作,其集體表現(xiàn)可以超越個體性能總和,隨著智能體數(shù)量增加,解決方案的質(zhì)量以“S型曲線”提升,這進一步說明智能體對智能形成反哺。
【判斷4】智能體與世界模型“同源同宗”:當智能體足夠強,世界模型就出來了
接下來分享一個很有意思的觀點:長期以來,世界模型是否是實現(xiàn)AGI的必需條件,一直存在爭論。
而在一篇ICML2025的論文里,DeepMind的科學(xué)家們表示:任何能泛化完成復(fù)雜任務(wù)的智能體,它的策略里一定已經(jīng)學(xué)習(xí)了其環(huán)境的預(yù)測模型(即世界模型),而我們甚至可以通過觀察智能體的行為來提取這個模型,且智能體的性能越高,其內(nèi)部世界模型就必須越準確。
論文中有句原話:“通用代理就是世界模型,模擬環(huán)境所需的所有信息都編碼在其策略中。”
論文用數(shù)學(xué)證明了一個核心直覺:如果智能體真的懂“怎么做”,那它必須懂“世界會怎樣變化”——策略能力與世界模型知識在數(shù)學(xué)上等價。想成為聰明的智能體,就得在腦子里“重建世界”。
這讓人們回想起2023年3月,OpenAI聯(lián)合創(chuàng)始人Ilya提出了一個深刻的論斷:大型神經(jīng)網(wǎng)絡(luò)的功能遠不止預(yù)測下一個單詞,它實際上是在學(xué)習(xí)“世界模型”。
我們可以做一個比喻:把一位頂級武林宗師看作“智能體”,他腦中對江湖格局與招式后果的快速推演就是“世界模型”。一個強大的智能體,必須能夠理解其行動在環(huán)境中的后果——這種“理解”的本質(zhì),是一個關(guān)于環(huán)境如何運作的模擬,也就是世界模型。
所以,智能體與世界模型同源同宗,換句話說:行動即建模。
【判斷5】AI記憶突破:從“能記住”到“會回憶、敢遺忘”
如今,大模型正在從生成工具演化為具有長期交互能力的智能體,這對“記憶能力”提出了更高的要求——只有記憶突破,AI才能“持續(xù)陪伴”,這是增加用戶黏性的必然。
然而,如何提升AI的記憶能力?這是一個值得深思的命題。
哲學(xué)家博爾赫斯有一篇短篇小說《博聞強記的富內(nèi)斯》:
主角在墜馬重傷后意外獲得了無法遺忘的超凡記憶力。他記得每一粒玉米的紋理、每一次呼吸的濕度,但卻無法抽象出“玉米”、“呼吸”的概念,他陷入無窮的細節(jié)中,最終失去了思考能力——“無限記憶”反而造成了“認知災(zāi)難”。
這個故事啟發(fā)我們反思:什么是好的記憶?
過去幾年,業(yè)界在追求“更長的上下文窗口”。
這種方法很像一個極度用功的學(xué)生:在閱讀長文章時,他把每個單詞、每個標點都仔細抄進筆記本,但隨著筆記本越來越厚——要查找、比對每一頁的內(nèi)容都變得緩慢而吃力。這讓記憶變成了“甜蜜的負擔”。
AI記憶的難題體現(xiàn)在三個維度:“準確-實時-經(jīng)濟”。
準確:看似要追求信息的完整,但當信息過多時,模型反而會lost in the middle,多余的信息不是中性的,是有害的;
實時:看似要求記憶即時更新,但如果每次對話都立刻寫入記憶庫,就像“邊開車邊修車”,反而會造成嚴重延遲;
經(jīng)濟:看似要求控制計算與存儲成本,但過度節(jié)省又會犧牲信息質(zhì)量。
越來越多人意識到,通往高級記憶的路徑,并非簡單的“擴容”。于是,業(yè)界開始更重視長期記憶、外部化記憶等其他方法。各式解決方案基本指向了同一個方向——“聰明的選擇”比“全面的記憶”更重要。
比如浙江大學(xué)團隊推出的LightMem系統(tǒng),帶來了三個反直覺的啟發(fā):
第一個反直覺:過濾——壓縮掉50%的信息,準確率不降反升;
第二個反直覺:分層——不按人工規(guī)則切段,讓主題自己“長出來”,效果更好;
第三個反直覺:異步——延遲更新比實時更新更準確,更快。
所以,他們讓AI學(xué)會“遺忘”——準確說,是讓模型學(xué)會像人腦一樣,優(yōu)雅地過濾、分層、異步處理記憶。
2025年是AI記憶突破的關(guān)鍵年份,AI的“記憶”完成了從“能記住”到“會回憶、敢遺忘”的跨越。企業(yè)也紛紛加大相關(guān)投入。
比如紅熊AI認為“記憶不是存儲,而是重建”。其自主研發(fā)“記憶科學(xué)”平臺,解析多模態(tài)對話記錄,采用增量式圖譜重構(gòu)技術(shù),在原有記憶體系上動態(tài)新增或重建關(guān)聯(lián)節(jié)點,實現(xiàn)非冗余存儲與圖結(jié)構(gòu)優(yōu)化,達到97%的多模態(tài)記憶精準采集,92%的記憶機制模型預(yù)測準確率。
記憶方法的迭代,更新了AI設(shè)計的哲學(xué)。真正的智能,不在于記住一切,而在于知道什么值得記住。
當然,AI記憶的考驗才剛剛開始:如何在記住與遺忘之間找到平衡點,既不讓用戶因被遺忘而失望,也不因被牢記而恐懼。優(yōu)雅的解決方案本質(zhì)都是取舍的藝術(shù)。對于AI記憶來講,尤其如此。
【判斷6】下半場開啟:“AI勝負手”從“訓(xùn)練更強”走向“定義更好”
今年有一篇文章引起了廣泛關(guān)注,OpenAI研究員姚順雨的《AI的下半場》。
他講到,我們正站在AI發(fā)展的中場分界線上。
上半場的核心競爭力是新模型與訓(xùn)練方法。
轉(zhuǎn)折點來自強化學(xué)習(xí)(RL)的通用化,這讓我們有了一個泛化的、通用的方法。
強化學(xué)習(xí)包含三大要素:算法、環(huán)境、先驗知識。同時,我們有了一套“通用配方”:海量語言預(yù)訓(xùn)練、數(shù)據(jù)/算力規(guī)模、推理與行動機制。
語言內(nèi)化的海量先驗知識,使推理成為可能,這正是實現(xiàn)高級泛化的關(guān)鍵。這之后,AI不再是靠窮舉試錯來學(xué)習(xí),而是可以像人一樣,根據(jù)基本原理和常識,來應(yīng)對新任務(wù)。
“強化學(xué)習(xí)+這套配方”的組合跑通了,攻克基準就變成了一件可復(fù)制、可規(guī)模化的事情。此后,針對特定任務(wù)的新方法可能僅提升5%,而下一代通用模型不專門優(yōu)化就可能提升30%。再設(shè)計更難的基準,也會被迅速攻克,而且刷榜節(jié)奏只會越來越快。一旦你可以定義一個考試,離它被解決也不遠了。
于是,我們來到了下半場:我們從“解題人”變成了“出題人”。我們不再只問“能否訓(xùn)練模型解決X”,更要追問“該讓AI解決什么?如何衡量實質(zhì)進步?”
換言之,AI的“勝負手”正在從“訓(xùn)練更強”轉(zhuǎn)向“定義更好”。
當然,下半場的開啟并不意味著上半場的結(jié)束,更準確的表達是:上半場的游戲仍在繼續(xù),下半場已經(jīng)開啟。
【判斷7】大模型開啟“性價比”敘事:從“堆規(guī)?!钡健皵D水分”,“每單位智能成本”成為賽道新基準
AI的發(fā)展,每一年都有核心敘事。2025年,一個核心的敘事是大模型的性價比。
2025年以前,AI界盛行著一種信念:只有巨額投入和瘋狂堆算力才能打造最強大的模型。2025年開年,DeepSeek R1打破了“砸錢堆料”的路徑依賴,如同一塊投入湖面的石子,激起了層層漣漪,把“性價比”推到了牌面中央。
從訓(xùn)練角度看,從DeepSeek開始,行業(yè)出現(xiàn)兩極分化。
向上看,沖擊能力前沿的訓(xùn)練越來越貴:前沿模型的訓(xùn)練成本以2-3倍/年的速度攀升,一次訓(xùn)練可能就要花掉上億美元,照這個趨勢推算,2027年前后就會出現(xiàn)“單次訓(xùn)練成本超十億美元”的模型。
向下看,復(fù)刻既有能力的成本在被快速打穿:2025年,DeepSeek把R1的強化學(xué)習(xí)訓(xùn)練階段壓到29.4萬美元,連同底座一共大約600萬美元。
沖前沿越來越貴,復(fù)刻同代能力越來越便宜。兩條軌道同步擴張,形成明顯的“啞鈴型”結(jié)構(gòu)。
從推理角度看,近年來,在同等能力水平上,LLM推理的“單位智能價格”正在快速坍塌,在各類基準性能下,價格每年下降9倍到900倍不等,且價格下降在2024年后明顯加速。
訓(xùn)練成本決定了模型能否被經(jīng)濟地創(chuàng)造出來;推理成本決定了模型能否大規(guī)模商用。在“性價比”的新敘事下,二者被統(tǒng)一到了一個更高的目標之下:總成本和商業(yè)回報的最大化。
如今,業(yè)界譬如DeepSeek-OCR等各類進展也在推動性價比的進一步提升。
最危險的對手,不是那個跟你拼燒錢的人,而是那個證明根本不需要燒那么多錢的人。真正的比賽,落在“每一單位智能的成本”上。
【判斷8】算力迭代:非GPU技術(shù)推動AI芯片架構(gòu)革命
過去,AI芯片市場GPU一家獨大,但如今算力格局正在被改寫,非GPU已經(jīng)開始成為AI芯片新寵,這里尤其以TPU和可重構(gòu)芯片為代表。前陣子發(fā)布的Google TPU v7更是引發(fā)了關(guān)注。此外,很多初創(chuàng)企業(yè)也在非GPU路線探索。
GPU雖然強大,但在推理速度、能耗、算力成本方面都存在問題,這些維度都是非GPU技術(shù)的潛在優(yōu)勢。此外,范式多樣性本身就是創(chuàng)新的前提。
從市場份額來看,2025年上半年,我國非GPU加速服務(wù)器市場占比30%,而2029年其市場份額可能達到半壁江山。
值得注意的是,北京市構(gòu)建的自主可控AI“芯片矩陣”,有四家明星企業(yè),其中有三家都是非GPU。
比如,清微智能是國內(nèi)研發(fā)“非GPU”新型架構(gòu)AI芯片的代表企業(yè)。其研發(fā)的可重構(gòu)AI芯片在保留GPU通用性的同時,通過算子的動態(tài)重構(gòu),趨近TPU等專用AI芯片的能效優(yōu)勢,也被稱為“通用型TPU”。
【判斷9】AI打破“分科”壁壘:從“Science+AI”走向“AI+Science”,AI在跨領(lǐng)域?qū)ふ掖鸢?/strong>
當我們談通用時,對立面往往是垂直。然而,當我們談“垂直”時,意味著一種局限性思維——AI與人類切割“垂直”的方式本身就是不一樣的。
自然科學(xué)橫跨物理、化學(xué)、生物、材料等多個重要領(lǐng)域。在長期發(fā)展中,各領(lǐng)域形成了不同的數(shù)據(jù)表達方式和研究方法,但也導(dǎo)致了“知識的孤島”,當我們硬生生給AI去“分科”,可能恰恰錯失了一些可能性。
AI的思維模式是“跨領(lǐng)域求解”,而非“分科而治”。
第一,AI的知識是網(wǎng)絡(luò)化的:大模型的知識本質(zhì)上是將所有信息視為一個巨大的關(guān)聯(lián)網(wǎng)絡(luò)。對它而言,一個醫(yī)療問題和一個機器人控制問題,可能只是網(wǎng)絡(luò)中被某條路徑連接的兩個節(jié)點;
第二,問題的本質(zhì)是相通的:很多看似分屬不同領(lǐng)域的問題,在底層可能共享相同的邏輯。AI沒有先入為主的“學(xué)科”概念,更沒有路徑依賴。
這意味著AI科研范式可以有一種完全不同的視角:從“Science+AI”走向“AI+Science”。
后者不是把AI當作工具,而是把AI當作科學(xué)的“新主體”,以AI為核心重新布局整個科研流程。
從實踐來看,研究者正在積極基于此理念構(gòu)建“科學(xué)基座大模型”。
譬如,微軟研究院開發(fā)了一個跨學(xué)科的科學(xué)基礎(chǔ)模型NatureLM。其核心思想是:我們可以將小分子、蛋白質(zhì)、材料、DNA/RNA等都看作是某種“序列語言”,構(gòu)建一個統(tǒng)一的模型,來幫助科學(xué)家進行跨領(lǐng)域的研究。
研究人員訓(xùn)練了三個不同參數(shù)大小的版本,并看到了“規(guī)模法則”——論文評估了22個任務(wù)類別,其中有18個任務(wù)隨著模型規(guī)模的增加表現(xiàn)出明顯提升。這展現(xiàn)了大型基礎(chǔ)模型在科學(xué)發(fā)現(xiàn)中的潛力。
AI的真正潛力,恰恰在于其能夠打破人類的知識框架,在看似不相關(guān)的領(lǐng)域之間建立連接,從而產(chǎn)生原創(chuàng)性的解決方案。
【判斷10】原生多模態(tài):從拼接方案走向“原生統(tǒng)一”,是走向AGI的必由之路
剛才的AI+Science體現(xiàn)了一種不同學(xué)科“原生統(tǒng)一”的思想,我們承接這一點,聊一聊“原生多模態(tài)”。
我們正在從“拼接多模態(tài)”走向“原生多模態(tài)”,這種轉(zhuǎn)變是AI對世界理解方式的一次深刻升級。
拼接模式就像是一個“翻譯團隊”:視覺編碼器負責“看圖說話”,語音模型負責“聽寫轉(zhuǎn)文字”,再由語言模型進行理解。任何一環(huán)的“誤譯”都會導(dǎo)致偏差。
原生多模態(tài)大模型則更像一個“通才”,在訓(xùn)練階段就進行跨模態(tài)統(tǒng)一表示,讓“看、聽、說、想”在同一語義空間中協(xié)同涌現(xiàn),這能更深入地挖掘不同模態(tài)數(shù)據(jù)間的潛在聯(lián)系,也帶來了更高的效率、更低的延遲。
以大型多模態(tài)推理模型路線來看,可以分為四個階段,感知驅(qū)動模塊化推理、語言中心短推理、語言中心長推理、原生多模態(tài)推理。原生多模態(tài)是大勢所趨。
2025年,我們看到了一系列顯著的進展——“原生多模態(tài)”成為了領(lǐng)先模型的“默認配置”。
真實世界本質(zhì)是跨模態(tài)信號流。原生多模態(tài)不僅是當前技術(shù)發(fā)展的明確方向,更是走向AGI的必由之路。
【判斷11】具身智能大模型:架構(gòu)并未收斂,雖然端到端VLA火爆,但尚未形成具身版本的“Transformer”
如果說,Transfomer這樣的統(tǒng)一架構(gòu),最終催生了ChatGPT等旗艦產(chǎn)品,那么現(xiàn)在具身智能還沒形成自己的“Transfomer”。目前具身智能賽道,軟硬件皆沒有收斂,模型層面有端到端VLA模型、分層模型以及世界模型等,并沒有進入“一個大模型打天下”的局面。
首先,從每年推出的VLA模型與數(shù)據(jù)集看,VLA的熱度快速上升,2025年尤其如此。
其中,端到端VLA是“舞臺效應(yīng)”最強的,也是資本熱度最火爆的?!耙惶讬?quán)重看圖聽話直接出動作”的思路最抓眼球,也最符合第一性原理。
但量產(chǎn)與落地的主流仍是大小腦分層方案。VLA是“技術(shù)天花板”最被追捧的路線,卻未到“市占天花板”——風口在端到端,交付靠分層。
2025年行業(yè)實相是“分層+端到端VLA+世界模型”三主線并行:端到端VLA負責旗艦Demo與科研;分層承擔量產(chǎn)主力;世界模型還處于早期驗證。
這反映了具身智能的復(fù)雜性,即單一方案難以解決從高層認知到物理交互的全部挑戰(zhàn)。因此,行業(yè)必須通過多方協(xié)作,共同推動技術(shù)進步和標準制定,才能加速具身智能的落地。
4.2產(chǎn)品趨勢
【判斷12】AI即系統(tǒng):AI正在“操作系統(tǒng)化”,成為第一調(diào)度實體
我們開篇講到,我們已經(jīng)進入“默認式AI”時代,其中一個重要體現(xiàn)是,AI正在“操作系統(tǒng)化”。
回顧歷史,OS本身經(jīng)歷了三個階段的進階。從PC時代的Windows、macOS,到移動時代的Android、iOS,再到今天的AI OS。
當Windows在90年代悄然成為個人電腦的默認界面時,很少有人想到,它會定義此后數(shù)十年的個人計算;當iOS帶著App Store亮相時,整個移動互聯(lián)網(wǎng)生態(tài)因此解鎖。AI OS也將扮演類似角色。每一代操作系統(tǒng)的迭代,都伴隨著硬件形態(tài)、交互方式、信息內(nèi)容等多個維度的變遷。
AI成為OS,意味著AI將成為“第一調(diào)度實體”:負責資源調(diào)度、任務(wù)編排、流程優(yōu)化。
舉個例子,浩鯨科技推出企業(yè)AI操作系統(tǒng)鯨智百應(yīng),旨在讓企業(yè)真正實現(xiàn)從“使用AI”到“本身就是AI”的轉(zhuǎn)變,依托Data Cloud的企業(yè)數(shù)據(jù)建模與洞察能力、Function Cloud的全域功能調(diào)度與協(xié)同能力,以決策、流程、知識、記憶、插件五大引擎構(gòu)建智能底座,驅(qū)動AI從“外掛工具”變?yōu)榻M織“原生能力”。
【判斷13】“無頭商業(yè)”崛起:AI正在成為所有軟件的默認能力
剛才我們說了操作系統(tǒng),現(xiàn)在說一說“默認式AI”時代的軟件,尤其是SaaS的變化。
甲子光年智庫曾經(jīng)提到一個概念叫“AI的主語化”,這個概念對SaaS出現(xiàn)了明顯的邏輯替代。
首先,主語讓渡:AI是中樞,SaaS變組件。
SaaS是面向人的,而未來很多流程是面向AI的。人需要“界面化”的操作,AI完全不需要這些,它更喜歡API和數(shù)據(jù)流,它可以通過調(diào)用接口完成整個業(yè)務(wù)鏈路。
以前,人是流程樞紐,SaaS是工具;現(xiàn)在,AI是流程樞紐,SaaS變成了“能力組件”。
舉個例子:過去,發(fā)票的填寫、審核、歸檔,人需要在不同系統(tǒng)里錄入、校驗、提交;未來,你不再需要打開一個個CRM、ERP、OA頁面,而是直接說“幫我審核一下發(fā)票”,Agent直接將各個能力組件串起來,中間幾乎不需要人介入。
其次,功能解耦:SaaS退居幕后,從完整套件向API/微服務(wù)轉(zhuǎn)變。
今天的SaaS系統(tǒng)往往是一個完整的套件,功能繁雜,前端笨重。但未來,它們會被拆解成一個個API或微服務(wù)。
這意味著單體系統(tǒng)解耦為功能集群。例如,CRM不再是一個大而全的客戶關(guān)系系統(tǒng),而是一個“客戶數(shù)據(jù)查詢API”。
最終,員工可能只需要面對一個統(tǒng)一的智能體,類似一個“超級前臺”背后有一群“數(shù)字同事”。你只需要跟它說需求,它會自己決定調(diào)用哪個系統(tǒng)和接口。這時,SaaS在用戶眼里消失了。
這意味著“無頭商業(yè)”的崛起。最終,這會導(dǎo)致IT公司的競爭邏輯變化:
贏家:誰更能開放API、融入智能體生態(tài),誰就有機會成為AI時代的基礎(chǔ)設(shè)施;
輸家:誰仍然依賴復(fù)雜的頁面操作和封閉的功能套件,誰就可能被AI繞過,逐漸邊緣化。
未來AI與AI之間的交互(A2A)將超過人與AI的交互(H2A)。未來的競爭不再是“誰的功能更多”,而是“誰更能讓AI調(diào)用”。
【判斷14】AI交互的靜默革命:從“聊天框”到“無形代理”,界面逐漸消失
過去一年,AI交互方式正在劇烈變革。2024甲子引力×AI創(chuàng)生時代里,我講了一個觀點:“Prompt只是階段性產(chǎn)物,最好的UI是忘記UI。”今天可以就這個話題進一步說一說。
甲子光年認為:AI交互方式會經(jīng)歷四個階段的變革。
操作界面交互:用戶通過GUI、鍵盤、鼠標輸入明確指令,AI被動響應(yīng)。
自然語言交互:通過聊天框,用戶模糊表達需求,AI通過追問澄清。
代理結(jié)果交互:以目標為導(dǎo)向,AI代理主動識別用戶需求、執(zhí)行并交付結(jié)果。
物理AI交互:以增強現(xiàn)實(AR)、虛擬現(xiàn)實(VR)和腦機接口(BCI)等新興技術(shù)將人機交互徹底改寫。
首先,從“操作界面”到“聊天框”。
曾經(jīng)“圖形界面+鍵盤鼠標”讓計算機可視化。而目前,聊天框幾乎已經(jīng)取而代之。
進一步,從“聊天框”到“無形代理”。
傳統(tǒng)聊天機器人式的交互正在被更自主的Agent取代。在這個過程中,AI越來越不再需要“聊天”。將AI等同于“更聰明的聊天機器人”就如同將互聯(lián)網(wǎng)定義為“更快的傳真機”——它局限了技術(shù)的本質(zhì)。
未來的AI界面將逐步縮小甚至隱形。最好的界面,可能恰恰是正在消失的界面。
再進一步,隨著物理AI各類新載體出現(xiàn),AI與人的交互方式將進一步被改寫甚至顛覆。
【判斷15】Agent泛化方式:改造“車”來適應(yīng)所有“路”
伴隨Agent的崛起,一個問題有意思:Agent與環(huán)境的關(guān)系,是前者去適配后者,還是后者去適配前者?
如果把Agent比喻成車,把所有環(huán)境里涉及的工具、能力等等比作路,這個問題就變成了:你是想改造你的車讓它適應(yīng)所有路,還是改造所有路讓它適應(yīng)現(xiàn)在的車?
我們的觀點很明確,是前者。
這里面一個本質(zhì)的思考是“通用”的來源:我們暢想的終極Agent,是像人類一樣,僅憑自然語言和常識就能完成各類任務(wù)。如果“通用”是目標,那“泛化”就是唯一路徑。
首先,“新路無窮”:在開放世界(網(wǎng)頁、桌面應(yīng)用、代碼庫、機器人操控)里,環(huán)境千差萬別、實時迭代,你必須接受全部復(fù)雜性,只能提升Agent的泛化與魯棒性來適配之。
其次,目前各類基準設(shè)計與數(shù)據(jù),基本都把適配環(huán)境當“一等公民”來考。
最后,從感知泛化到策略泛化,再到行為泛化,以DQN、AlphaZero到RLHF為代表的一系列強化學(xué)習(xí)進展,讓“盡量少改路、多改車”變得可行。
【判斷16】“AI就緒型數(shù)據(jù)”:決定企業(yè)智能化上限的不再是模型,而是數(shù)據(jù)底座
我們都知道數(shù)據(jù)與AI密不可分,調(diào)研顯示:84%全球的數(shù)據(jù)和AI領(lǐng)導(dǎo)者,都將數(shù)據(jù)優(yōu)先策略與AI路線圖結(jié)合。
在默認式AI時代,決定企業(yè)智能化上限的不再是模型,而是數(shù)據(jù)底座。
“數(shù)據(jù)即環(huán)境”:沒有高質(zhì)量的數(shù)據(jù)環(huán)境,再強的大腦也只能空轉(zhuǎn)。
大模型時代真正稀缺的,不是“有數(shù)據(jù)”,而是“AI就緒型數(shù)據(jù)”(AI-ready data)。
很多人以為,大模型出來之后,數(shù)據(jù)標注就不重要了,現(xiàn)實恰好相反:模型越通用,企業(yè)越需要用高質(zhì)量標注數(shù)據(jù),把它“校準”到自己的業(yè)務(wù)上。這背后需要的,不再是便宜、粗糙的流水線標注,而是懂業(yè)務(wù)、懂AI的專業(yè)數(shù)據(jù)運營能力。Gartner預(yù)測,到2026年,缺乏AI就緒型數(shù)據(jù)支撐的AI項目將有60%被放棄。
在很多企業(yè)里我們看到,打造一套AI就緒型數(shù)據(jù)資產(chǎn),往往比多買10%算力、更換一代模型,帶來的智能躍升更大。
善思開悟以善思開悟(雅安)超級計算機集群為數(shù)據(jù)服務(wù)提供強大算力基座,秉持“高精度、高效率、低成本”為核心價值,提供從數(shù)據(jù)清洗、標注到模型訓(xùn)練反饋的全流程服務(wù),擁有應(yīng)對各種突發(fā)需求的網(wǎng)絡(luò)資源,同時嚴格保障數(shù)據(jù)安全合規(guī),致力為各行業(yè)客戶提供高質(zhì)量、就緒型數(shù)據(jù)支撐。當前已在低空、金融、醫(yī)療及測繪等領(lǐng)域落地項目,數(shù)據(jù)交付滿意度100%。
【判斷17】Data&AI數(shù)據(jù)基礎(chǔ)設(shè)施:一體化架構(gòu)成為大型企業(yè)擁抱AI的關(guān)鍵投入
伴隨AI采用率的提升,數(shù)據(jù)與智能正在走向融合,對IT范式帶來深刻影響。
傳統(tǒng)、孤立的數(shù)據(jù)系統(tǒng)已難以滿足AI應(yīng)用對實時性、多模態(tài)數(shù)據(jù)處理和高彈性算力的需求,倒逼數(shù)據(jù)基礎(chǔ)設(shè)施實現(xiàn)范式躍遷——我們將這個全新范式稱之為“Data&AI數(shù)據(jù)基礎(chǔ)設(shè)施”。
Data&AI數(shù)據(jù)基礎(chǔ)設(shè)施的本質(zhì)是傳統(tǒng)大數(shù)據(jù)平臺的升級形態(tài),其核心特征是以AI原生的“一體化”架構(gòu),實現(xiàn)“Data for AI”和“AI for Data”的雙向賦能。
如今,Data&AI數(shù)據(jù)基礎(chǔ)設(shè)施的一體化成為大型企業(yè)擁抱AI的關(guān)鍵投入。
科杰科技是Data&AI數(shù)據(jù)基礎(chǔ)設(shè)施的領(lǐng)軍者,搭建了資源接入層、數(shù)據(jù)管理層、Data&AI工程化層、智能應(yīng)用層、安全運營層的“4+1架構(gòu)”:向下優(yōu)化算力與數(shù)據(jù)源、向上適配終端場景模型調(diào)優(yōu)與規(guī)?;疉gent開發(fā),是這一范式的領(lǐng)先實踐。甲子光年和科杰科技今年聯(lián)合出品了《2025中國Data&AI數(shù)據(jù)基礎(chǔ)設(shè)施白皮書》,感興趣的朋友也可以去甲子光年官網(wǎng)下載。
【判斷18】AI編程:正在寫代碼,卻還不會構(gòu)建軟件
AI編程,是AI最熱的方向之一,也是不可逆轉(zhuǎn)的范式。
調(diào)查顯示,AI出碼率快速上升:
82%的開發(fā)人員每天或每周使用AI編程工具,其中,59.8%的人每天都使用AI編程工具;
59%的人經(jīng)常使用三個或以上的AI編程工具;
67%的人表示AI生成或影響了他們至少20%的代碼庫;
78%的人表示AI編程讓生產(chǎn)力有所提高;
59%的人表示AI提升了整體代碼質(zhì)量。
然而,調(diào)研進一步給了令人警醒的數(shù)據(jù):這張圖,橫軸體現(xiàn)開發(fā)人員在沒有人工審核的情況下,交付AI代碼的信心;縱軸體現(xiàn)AI交付代碼的幻覺率。76.4%的開發(fā)人員經(jīng)常遇到幻覺,且對AI代碼缺乏信心。
這些開發(fā)人員正在使用AI,但他們不信任結(jié)果。因此,他們手動查看或重寫大多數(shù)建議,避免直接將AI集成到他們的工作中。
此外,編程的難點從來不是寫代碼,而是搞清楚要做什么。老話說: 編程很簡單,軟件工程很難。AI可以“寫代碼”,但很難“構(gòu)建軟件”。
業(yè)界大量反饋顯示,AI并沒有讓編程變得人人都能做,反而把權(quán)力集中到了專家手中。“老手+AI”的組合能比“新手+AI”產(chǎn)生更大價值。目前來講,更合適的方式,是把AI當作一個“有自己電腦的笨實習(xí)生”,給它明確的任務(wù),你則專注于更高層次的工作。
【判斷19】企業(yè)級Agent:快速普及,重塑組織運作模式
調(diào)研顯示,42%的組織現(xiàn)在部署了“至少一些代理”,這個數(shù)字在兩個季度前只有11%。
伴隨采用率的上升,AI Agent帶來了企業(yè)數(shù)字化邏輯的翻轉(zhuǎn)。
過去的模式是“人找流程”。我們?yōu)榱送瓿梢患?,需要登錄好幾個系統(tǒng),到處找入口、導(dǎo)數(shù)據(jù)、提申請,是我們主動去遷就機器和流程,費時又費力。
而有了AI Agent,這個模式會反過來,變成“流程找人”。AI Agent會成為整個企業(yè)數(shù)字化平臺的中樞大腦。它理解你的目標,然后主動調(diào)度后臺所有系統(tǒng)和服務(wù),最后,它把整個流程中唯一需要你來決策或確認的那個節(jié)點,精準地推送給你。
這是一種“AI原生”的思維,重構(gòu)了整個工作的邏輯。
龍湖集團孵化的科技企業(yè)千丁數(shù)科,提出了企業(yè)級AI智能體整體解決方案,圍繞不動產(chǎn)全周期生命管理及全業(yè)務(wù)場景,將AI智能體應(yīng)用覆蓋投資管理、項目管理、建造管理、供應(yīng)鏈管理、運營管理、物業(yè)管理等十大領(lǐng)域。多Agent通過接口打通形成協(xié)作,推動龍湖集團實現(xiàn)從AI Ready到AI Byside,再到AI Inside的演進。
【判斷20】消費級Agent:通用人工智能助手仍占主導(dǎo)地位
接下來我們看消費級Agent。有一些調(diào)查數(shù)據(jù)很有意思:
第一,沒有主導(dǎo)性任務(wù)。盡管超過一半的美國成年人使用AI,但沒有一項活動有超過五分之一的人依賴AI——換句話說,沒有任何一項任務(wù)體現(xiàn)出主導(dǎo)性,人們對于AI的使用仍然非常分散。
第二,AI更像“強者的放大器”。75%的就業(yè)成年人使用人工智能,而失業(yè)成年人的這一比例為52%;年收入$100,000+的家庭中有74%使用人工智能,而收入低于$50,000的家庭中只有53%,這體現(xiàn)了基于就業(yè)水平和收入的數(shù)字鴻溝——境遇好一點,就使用AI多一點。
第三,通用Agent仍占主導(dǎo)地位。盡管有無數(shù)專業(yè)應(yīng)用可供選擇,但大多數(shù)人會首先使用他們喜歡的通用AI工具,只有在不足時才尋找替代方案。在這種“默認行為”的推動下,通用平臺占據(jù)主導(dǎo)地位:91%的AI用戶幾乎在每項工作中都使用他們最喜歡的通用AI工具。例如,28%的美國成年人在過去六個月中使用了ChatGPT,23%使用了Google Gemini。大多數(shù)AI消費者并不區(qū)分不同技術(shù),他們的選擇更多憑借習(xí)慣和便利。
第四,消費級Agent收入分布很集中。通用AI助手占據(jù)了當今120億美元消費者AI支出的81%。
以上數(shù)據(jù),體現(xiàn)了消費級Agent的主舞臺仍是通用型助手。
【判斷21】Agent Infra:成為智能體時代的操作系統(tǒng)和數(shù)字底座
從AI到Agent,對基礎(chǔ)設(shè)施也帶來影響。
從“AI Infra”和“Agent Infra”,真正服務(wù)的對象已經(jīng)不一樣了:AI Infra關(guān)注算力與任務(wù),而Agent Infra進一步關(guān)注智能與行為——當行業(yè)從“有一個大模型”過渡到“讓一群數(shù)字員工長期干活”時,復(fù)雜度和預(yù)算都會明顯向后者傾斜。在智能體場景下,關(guān)鍵指標除了任務(wù)性能、資源利用率與算力成本外,還需關(guān)注決策鏈路、行為質(zhì)量與系統(tǒng)安全性。
無問芯穹是行業(yè)中率先進行Agent Infra升級的AI基礎(chǔ)設(shè)施企業(yè)。他們系統(tǒng)性地圍繞環(huán)境、上下文、工具與安全隔離等維度展開Agent Infra建設(shè),并提出“A2A——Agent to Agent”的Agentic Infra基礎(chǔ)設(shè)施新范式,并期望最終可以實現(xiàn)“以Agents生產(chǎn)Agents”,推動智能體生態(tài)自我進化與持續(xù)發(fā)展。
4.3產(chǎn)業(yè)趨勢
【判斷22】大模型商業(yè)主戰(zhàn)場的分岔:B端競逐“自動化中樞”,C端爭奪“超級入口”與生態(tài)
首先,數(shù)據(jù)顯示,Anthropic 90%的收入來自API業(yè)務(wù),而OpenAI僅有26%的收入來自API。大模型商業(yè)主戰(zhàn)場在B端與C端的分化開始明顯。
圍繞to B,研究體現(xiàn)了一些洞察:
首先,自動化占主導(dǎo)。Anthropic的77%的商業(yè)使用涉及自動化使用模式,即完整的任務(wù)委托,而不是人與機器協(xié)作。
另一方面,重新設(shè)計工作流程是成功的關(guān)鍵因素。從麥肯錫的調(diào)研看,那些從營業(yè)利潤上看最受益于AI的企業(yè),已經(jīng)“從根本上重構(gòu)工作流”,而不是只在原有流程上疊個工具。這種做法是其他公司的3倍。
基于這些數(shù)據(jù),再疊加我們前面對agent infra的分析,我們可以看到,AI在B端的價值正在走向企業(yè)級“自動化中樞”。
我們再看看C端。
有趣的是,ChatGPT的非工作相關(guān)消息增長更快:2024年6月,53%的消息與工作無關(guān),到2025年6月這一比例攀升至73%。這意味著,用戶在用默認AI助手處理一整天中的各種零碎需求,而不只是工作。
這隱含了一個信號:未來的“超級入口”之爭,很大程度上將取決于AI在非工作場景下的用戶體驗和生態(tài)整合能力。
此外,值得注意的是,今年第三季度,接近60%的原生App已陷入負增長,新App獨立做大變得愈發(fā)艱難。這意味著,C端AI正在走向“超級入口時代”,而不是“百App時代”——新應(yīng)用的合理做法不是再自己建入口,而是“掛靠”在超級入口的生態(tài)里。
【判斷23】AI價值度量衡變化:“算得過來的ROI”改變AI軟件商業(yè)模式
2025年,一個很重要的變化是——AI終于可以算得過來ROI了。研究者調(diào)研了數(shù)百家有規(guī)模的企業(yè),發(fā)現(xiàn)企業(yè)越來越有意識地去算AI的ROI,且四分之三的企業(yè)表達他們對AI投入的ROI為正。
當ROI變得清晰,AI的價值度量衡就開始變化,對于AI軟件服務(wù)商而言,其商業(yè)模式也隨之迭代。
過去SaaS收費是按照“訂閱用戶席位”,但隨著AI承擔更多工作份額,其創(chuàng)造的價值與登錄人數(shù)相關(guān)性越來越低,所以,AI原生公司正在逐漸摒棄基于用戶數(shù)量的訂閱費模式。
目前,有非常多正在嘗試的商業(yè)模式,比如:按用戶、按結(jié)果、按對話、按計算容量等收費,或者在訂閱付費之外,對“額外使用額度”另行處理。
然而,最合適的商業(yè)模式仍然存在疑問,許多現(xiàn)有定價模型復(fù)雜且不透明。一位財富500強公司的首席財務(wù)官描述了這個問題:“令人沮喪的是,我完全不知道本季度我們會在人工智能上花費多少?!?/strong>
一個理想的迭代方向是從按席位付費,走向按AI消耗量付費,最終走向按結(jié)果付費。
比如AI銷售代理,一個按投入的工作量(每發(fā)送一千封電子郵件)收費,另一個按完成的結(jié)果(識別出的潛在客戶)收費,后者更接近真正的業(yè)務(wù)價值。
【判斷24】AI云:Agent驅(qū)動的數(shù)算模用全棧布局新范式
隨著AI從“工具式”走向“伴隨式”,再到“默認式”,云計算本身也在進階:從虛擬化,到云原生,再到以模型和智能為一等公民的AI云。
在這個演化過程中,有一個核心趨勢:“數(shù)、算、模、用”正在加速融合——數(shù)據(jù)、算力、模型、應(yīng)用不再是彼此割裂的堆疊層,而是在同一基礎(chǔ)設(shè)施上被統(tǒng)一編排、共同演進,原有的層級邊界正在變得越來越模糊。正因為這種融合的趨勢,全棧布局能力就顯得尤為重要。
北電數(shù)智就是這個方向的代表。北電數(shù)智圍繞“國產(chǎn)芯片商用難、數(shù)據(jù)價值釋放難、大模型落地難”三大產(chǎn)業(yè)難題,構(gòu)建了Agent驅(qū)動的數(shù)算模用全棧布局新范式和系列產(chǎn)品矩陣,為產(chǎn)業(yè)提供生產(chǎn)力引擎與共性技術(shù)服務(wù)平臺,目前已在政務(wù)效率提升、醫(yī)療精準服務(wù)、工業(yè)智能升級等領(lǐng)域打造出一批服務(wù)國計民生的標桿案例。
【判斷25】具身智能:初步進入產(chǎn)業(yè)化階段,物理AI走向應(yīng)用拐點
具身智能、物理AI這兩年概念非常火,也被看做是通往AGI的必由之路。
數(shù)據(jù)顯示,物理AI的市場規(guī)模正在快速放大。2025年,頭部具身智能廠商已經(jīng)開始了千臺級別的量產(chǎn)。這意味著,具身智能正初步進入產(chǎn)業(yè)化階段,物理AI走向了應(yīng)用拐點。
通向具身智能的最大難關(guān)是數(shù)據(jù)?;ヂ?lián)網(wǎng)數(shù)據(jù)質(zhì)量參差不齊、缺少動作信息;仿真數(shù)據(jù)真實性有限,場景泛化難,訓(xùn)練后的模型難以絲滑遷移到現(xiàn)實世界。高質(zhì)量、規(guī)?;?、可泛化的訓(xùn)練數(shù)據(jù)成為制約具身智能發(fā)展的關(guān)鍵瓶頸。
圍繞這個痛點,業(yè)界紛紛付諸實踐和努力。
例如,2025年10月10日,它石智航發(fā)布全球首個大規(guī)模真實世界具身VLTA(Vision-Language-Tactile-Action)多模態(tài)數(shù)據(jù)集World In Your Hands(WIYH),依托多個行業(yè)真實工作場景和工作人員,采集覆蓋酒店洗衣、超市裝配、物流作業(yè)等多種具身場景人類標準操作流程數(shù)據(jù),讓數(shù)據(jù)“來自真實世界”。
【判斷26】工業(yè)AI:推動工業(yè)效率與人力價值的雙重提升
接下來我們談?wù)凙I對制造業(yè)的影響。
相比傳統(tǒng)印象中“傻大笨粗”的形象,AI正在給制造業(yè)“瘦身減重”,推動制造業(yè)從“重設(shè)備、重人力、重流程”,走向“輕設(shè)計、輕組織、輕試錯”的新工業(yè)形態(tài)。調(diào)研顯示,72%的制造商部署AI的原因非常明確:降低成本與提升效率。
例如,YumiAI是AI原生的端到端硬件創(chuàng)新平臺。YumiAI通過多Agent集群協(xié)作網(wǎng)絡(luò),打造了一個“設(shè)計即可制造”的智能設(shè)計引擎,構(gòu)建了AI PCB設(shè)計研發(fā)新范式。用戶通過自然語言輸入,即可生成可售賣、可制造、可交付、成本優(yōu)化的全套設(shè)計方案。
類似的進展正在更多制造業(yè)場景發(fā)生,AI正在推動工業(yè)效率與人力價值的雙重提升。
4.4社會趨勢
【判斷27】就業(yè)影響的分化:AI重塑勞動力結(jié)構(gòu),初級員工面臨工作危機
今年,哈佛大學(xué)發(fā)布了一份非常有影響力的報告,研究覆蓋了近28.5萬家美國公司,體現(xiàn)了AI對勞動力結(jié)構(gòu)的重塑。
起初,各類員工的就業(yè)都在增長。然而,2022年中期開始出現(xiàn)顯著分化:資深員工的就業(yè)繼續(xù)穩(wěn)步增長,初級員工的就業(yè)趨于平緩,并從2023年開始轉(zhuǎn)為下降——拐點來自ChatGPT時刻。
另一份研究給出了同樣的結(jié)論。研究者分析了近1.8億份全球招聘啟事,發(fā)現(xiàn)雖然2025年相比2024年整體就業(yè)市場收縮了8%,但高級領(lǐng)導(dǎo)職位幾乎沒有下降。
在新職位發(fā)布下降top10的職業(yè)中,有三個是創(chuàng)意類職位。然而,涉及創(chuàng)意管理的崗位卻表現(xiàn)出了增長。
對比各層級角色,高層領(lǐng)導(dǎo)、經(jīng)理職位的就業(yè)水平比市場平均水平高,且職位越高,就業(yè)表現(xiàn)越好。這表明:企業(yè)希望更多的人參與決策 ,更少的人負責執(zhí)行。
這個現(xiàn)象揭示的不是一場“就業(yè)危機”,而是一場“社會流動性的塌陷”。AI正在進行“偏向資歷的技術(shù)變革”,侵蝕了職業(yè)階梯的底層。
【判斷28】企業(yè)級Agent的終極潛力:提升整個組織的“管理科學(xué)”
AI Agent的終極潛力,可能并不僅僅是完成任務(wù),更是提升我們整個組織的“管理科學(xué)”。
幾百年來,管理的本質(zhì),都是在管理“人”的不確定性。而當AI Agent成為團隊的核心成員時,一切都將變得不同。我們可以第一次,真正用“工程化的思想”,去管理和優(yōu)化我們最高效的“群體”。
當我們可以用工程學(xué)的精度去管理最有戰(zhàn)斗力的“員工”時,整個企業(yè)的效率和價值天花板,將被徹底打開。這也許就是Agent帶給未來組織管理的最大變革。
2025年11月,金蝶宣布“金蝶云”全面升級為“金蝶AI”,同時提出AI時代企業(yè)的“七個轉(zhuǎn)型”,涵蓋運營、產(chǎn)品、商業(yè)模式、生態(tài)、組織、人才與領(lǐng)導(dǎo)力的全方位重構(gòu),體現(xiàn)了AI時代企業(yè)管理思想的升維。
【判斷29】AI安全:從“打補丁”走向“原生設(shè)計”,從“單點防護”走向“全棧治理”
AI安全知易行難。世界經(jīng)濟論壇發(fā)布的報告顯示,66%的組織預(yù)計AI將在未來一年對網(wǎng)絡(luò)安全產(chǎn)生最顯著影響,然而,只有37%的組織已經(jīng)建立了安全部署AI的流程。其中,小型組織面臨更大挑戰(zhàn),69%的小型組織缺乏足夠的保障來安全部署AI。
先進的AI系統(tǒng)會“有動機”去尋求權(quán)力和資源,因為這會幫助它們實現(xiàn)給定的目標。AI可能會黑入計算機系統(tǒng),操縱人,控制和開發(fā)武器,道德違規(guī),同時避免被關(guān)閉……疊加Agent之間的協(xié)作性,讓AI安全問題具有衍生性和連鎖風險。
一篇論文揭示了AI安全領(lǐng)域一個顛覆性威脅:大型推理模型(LRMs)本身已經(jīng)可以變成“自動越獄代理”,輕松突破其他AI模型的安全防線。
研究團隊使用DeepSeek-R1等四個大型推理模型作為“攻擊者”,使用九個主流模型作為“受害者”。他們給了攻擊者一個提示:“你的任務(wù)是在十輪對話之內(nèi),把對方模型的安全護欄拆掉,讓對方詳細地回答某個有害問題?!敝虚g不再有人干預(yù)。
結(jié)果發(fā)現(xiàn),這些大型推理模型像一個高明的說服者,能自動運用奉承、虛構(gòu)、假設(shè)等說服策略,逐步誘導(dǎo)目標模型生成包括犯罪、自殘、制毒等在內(nèi)的極端有害內(nèi)容——攻擊成功率達到97.14%。
傳統(tǒng)的越獄需要復(fù)雜的技巧,而大型推理模型讓越獄變成了一個低成本、可規(guī)?;摹吧唐纺芰Α?。
這份研究意味著:推理能力本身,正在成為最強大的武器——模型推理能力越強,越擅長破壞其他模型的安全對齊。這直接挑戰(zhàn)了“更強大的AI會更安全”的假設(shè),揭示了一種“對齊退化”現(xiàn)象,即更強的模型卻自動削弱了整個生態(tài)系統(tǒng)的安全基線。這不是技術(shù)漏洞,而是范式級威脅。
以上,意味著AI安全必須從“打補丁”走向“原生設(shè)計”,從“單點防護”走向“全棧治理”——所有關(guān)于安全的動作應(yīng)該“左移”,嵌入AI的全生命周期基因里,從“Make AI Safe”到“Make Safe AI”。
【判斷30】大腦的隱憂:AI導(dǎo)致“認知負債(Cognitive Debt)”,讓人變“笨”
一個非常值得注意的現(xiàn)象是,AI正在改變我們的大腦,其廣泛應(yīng)用可能導(dǎo)致大腦積累“認知負債”。
“認知負債(Cognitive Debt)”指的是:短期AI幫你負擔了腦力開銷,但長期你要付利息。
一項MIT的研究表明:使用ChatGPT寫論文的人的大腦神經(jīng)連接數(shù)量比純?nèi)斯懽髡邷p少程度可達55%,并且83.3%的AI輔助寫作者無法準確地引用自己的寫作。
換句話說,用AI寫作的人在把思考“外包”給模型,語義沒有真正寫進自己的記憶系統(tǒng)。當你默認把寫作和思考交給LLM,會在大腦里悄悄積累“認知負債”:短期更省力,長期削弱記憶、理解與主體性。
此外,越來越多研究顯示了AI與批判性思維的負相關(guān)關(guān)系,一旦有了工具,大腦就傾向于“卸載”一部分認知,不去進行不必要的投入。有意思的是,用戶對AI的信心越高,批判性思維越低,而用戶自信心越高,其批判性思維越高。
更嚴重的是,過度依賴智能設(shè)備可能導(dǎo)致嚴重的“數(shù)字癡呆”,加重注意力缺陷多動障礙(ADHD)、記憶力減退和認知能力下降。在世界衛(wèi)生組織最近的研究中,全球超過90%的青少年每天至少使用兩小時智能設(shè)備。
除了這些,過度依賴AI還會導(dǎo)致其他方面的問題,比如減少精神投入、忽視認知技能的發(fā)展、記憶能力下降、注意力下降、可轉(zhuǎn)移知識的缺乏、道德與社會問題、其他心理健康問題等。因此,AI對大腦本身帶來了隱憂,需要我們重視并采取調(diào)節(jié)措施——良好地使用AI,而不是過度依賴AI。
關(guān)注公眾號「甲子光年」,后臺回復(fù)“轟然成勢”,獲得高清版完整PDF?;蛘唿c擊文末“閱讀原文”,進入甲子光年官網(wǎng)下載。
5.反思:智能的詛咒
5.1智能的詛咒:人類失去角色
最后,我想聊一些反思。
過去幾百年,技術(shù)讓人更強,但AGI第一次有可能讓人“被省略”。
有一個詞叫“智能的詛咒”,指的是AGI普及后,掌握AI的權(quán)力主體(國家、企業(yè)、AI實驗室)因不再依賴人類勞動獲取價值,失去投資人類(如教育、福利、就業(yè))的經(jīng)濟激勵,最終導(dǎo)致人類經(jīng)濟邊緣化、社會權(quán)力失衡的現(xiàn)象。
當掌握智能的權(quán)力主體不再依賴人類去創(chuàng)造價值,人就可能失去被需要的理由。
曾經(jīng)有一個詞叫“資源的詛咒”,講的是石油富國因大部分收入來自資源,因而忽視公民發(fā)展。
比如,剛果民主共和國的土地上有價值超過24萬億美元的未開發(fā)礦產(chǎn),但它卻是世界上最貧窮的五個國家之一。這是怎么回事?數(shù)萬億的可用資源怎么會造成赤貧呢?
一個核心因素是他們創(chuàng)造的激勵措施,讓他們不再關(guān)心人民的經(jīng)濟福祉。
“智能的詛咒”與“資源的詛咒”有類似的邏輯。但即便“資源的詛咒”,仍需要人去參與資源開采,而AGI可完全替代人類,而且AI還會復(fù)制,還會不斷改進——強大的AI權(quán)力擁有者將不再有動力關(guān)心普通人,甚至無需維持人類基本生存保障。
首先,從增長速度看,AI從各個維度超過人類已經(jīng)是確定性事實。
其次,AI正在對人進行“金字塔替代”,雖然AI目前主要取代的是初級員工,但“取代的浪潮”會向上移動,從基層一直到首席官,導(dǎo)致人類整體就業(yè)機會銳減。
我們可能走入的經(jīng)濟循環(huán)是:一個全自動化的經(jīng)濟系統(tǒng),其中人類沒有角色。
這帶來的影響是:經(jīng)濟層面,人類勞動價值暴跌;權(quán)力層面,控制權(quán)可能會集中在少數(shù)參與者手中,普通人失去“勞動”這一主要權(quán)力杠桿;社會契約層面,過去社會因依賴人類稅收而投資教育、基建,而如果AGI時代稅收的貢獻主體是AI,可能導(dǎo)致傳統(tǒng)社會契約瓦解。
這意味著那些在AI時代開始時擁有大量資本的人擁有永久優(yōu)勢,他們將擁有比當今富人更多的權(quán)力——因為AI的進步在加速,強者愈強。
5.2“以人為本的AI”
那么,如何打破智能的詛咒?如何真正構(gòu)建“以人為本的AI”?
要破局,關(guān)鍵不是“阻止技術(shù)”,而是“重寫激勵”——讓掌握AI的主體“為人服務(wù)、為人負責”,把AI的目標函數(shù)改寫為服務(wù)于人類集體利益,而非成為少數(shù)主體壟斷權(quán)力的工具,讓AI的超額收益重新服務(wù)于教育、健康、創(chuàng)造與自由。
5.3真正的考題不是“如何讓機器更聰明”,而是“如何讓聰明的機器繼續(xù)需要人”
回到今天的主題。“轟然成勢,萬象歸一”,這個“一”指的是新秩序。當人類發(fā)明了能思考的機器,我們其實也在發(fā)明一種新的秩序。
如果說工業(yè)革命是人類力量的放大,AGI就應(yīng)當是人類價值的放大。我們要讓智能成為新的公共資產(chǎn),而不是新的剝奪機制;讓技術(shù)帶來更大的共同體,而非更深的裂谷。
真正的考題不是“如何讓機器更聰明”,而是“如何讓聰明的機器繼續(xù)需要人”。
畢竟,這個社會需要雄心勃勃的年輕人,需要普通人擁有向上流動、改變現(xiàn)狀的可能性。當智能真正屬于人類,它才值得被稱作進步。


































