(網(wǎng)經(jīng)社訊)1月22日,百度正式發(fā)布并上線原生全模態(tài)大模型“文心5.0”正式版。該模型參數(shù)規(guī)模達(dá)2.4萬億,采用原生全模態(tài)統(tǒng)一建模技術(shù),具備全模態(tài)理解與生成能力,支持文本、圖像、音頻、視頻等多種信息的輸入與輸出。目前,個(gè)人用戶可通過文心APP、文心一言官網(wǎng)體驗(yàn),企業(yè)與開發(fā)者可通過百度千帆平臺調(diào)用。
據(jù)網(wǎng)經(jīng)社產(chǎn)業(yè)電商臺(B2B.100EC.CN)獲悉,百度集團(tuán)副總裁、深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程研究中心副主任吳甜介紹,與業(yè)界常見的“后期融合”方案不同,文心5.0采用統(tǒng)一的自回歸架構(gòu)進(jìn)行原生全模態(tài)建模,將多源數(shù)據(jù)在同一框架中聯(lián)合訓(xùn)練,實(shí)現(xiàn)多模態(tài)特征協(xié)同優(yōu)化。該模型采用超大規(guī)?;旌蠈<医Y(jié)構(gòu),激活參數(shù)比低于3%,在保持模型能力的同時(shí)提升推理效率,其工具調(diào)用與智能體能力也通過多輪強(qiáng)化學(xué)習(xí)訓(xùn)練得到顯著增強(qiáng)。
在多項(xiàng)權(quán)威基準(zhǔn)測試中,文心5.0正式版在語言與多模態(tài)理解能力上超越Gemini-2.5-Pro、GPT-5-High等模型,圖像與視頻生成能力與專業(yè)模型相當(dāng),整體進(jìn)入全球第一梯隊(duì)?,F(xiàn)場演示顯示,該模型可基于視頻教程自動拆解步驟并生成可運(yùn)行代碼,還能模擬特定人物風(fēng)格進(jìn)行創(chuàng)意寫作,展現(xiàn)出較強(qiáng)的多模態(tài)任務(wù)處理與情境理解能力。
“文心導(dǎo)師”計(jì)劃目前已吸納835位來自科技、金融、文化、教育、醫(yī)療、能源等多個(gè)行業(yè)的專家,在知識傳授、專業(yè)校準(zhǔn)等方面對大模型進(jìn)行指導(dǎo),持續(xù)提升模型的邏輯嚴(yán)謹(jǐn)性、專業(yè)深度與價(jià)值觀對齊。
2025年11月百度發(fā)布文心5.0 Preview版本以來,該系列模型多次在LMArena全球大模型競技場位列國內(nèi)第一、國際前列,2026年1月15日,其以1460分的成績在文本榜排名國內(nèi)第一、全球第八。該模型正式上線標(biāo)志著百度在原生全模態(tài)技術(shù)路線上進(jìn)一步成熟,有助于提升我國在多模態(tài)大模型領(lǐng)域的自主創(chuàng)新與全球技術(shù)話語權(quán)。


































