(網(wǎng)經(jīng)社訊)11月7日,北京第二外國語學(xué)院數(shù)字文旅研究中心在杭州主辦的研討會上,正式發(fā)布了國內(nèi)首份系統(tǒng)性的《AI旅行助手評價體系》。該體系旨在為快速成長但標(biāo)準尚不完善的AI旅行規(guī)劃領(lǐng)域建立科學(xué)的評測基準,以引導(dǎo)行業(yè)向高質(zhì)量和標(biāo)準化方向發(fā)展。
當(dāng)前,隨著生成式人工智能技術(shù)的發(fā)展,AI旅行助手市場已形成包括在線旅游平臺(OTA)代表的“交易閉環(huán)型”助手、泛生活類平臺代表的“內(nèi)容生態(tài)型”助手、基于通用大模型的“信息生成型”助手以及依托通用智能體平臺的“服務(wù)聚合型”助手四大類產(chǎn)品競相發(fā)展的格局。然而,行業(yè)在“何為智能”及“如何評價”等核心問題上缺乏共識,導(dǎo)致產(chǎn)品優(yōu)化方向不明確,用戶體驗差異較大。
據(jù)網(wǎng)經(jīng)社數(shù)字生活臺(DL.100EC.CN)了解,針對這一行業(yè)痛點,北二外數(shù)字文旅研究中心構(gòu)建了一套包含“可用性”、“易用性”、“個性化”、“安全性”和“流暢性”五個維度的AI旅行助手綜合評價體系。該體系共細化為24項可量化的三級指標(biāo),全面覆蓋從用戶需求理解、行程規(guī)劃到服務(wù)履約的全流程體驗。
研究團隊基于此評價體系對當(dāng)前市場主流的八款A(yù)I旅行助手產(chǎn)品進行了首輪橫向評測。初步結(jié)果顯示,行業(yè)整體處于“快速成長早期”,平均得分為689.49分(滿分900),并呈現(xiàn)出“強于內(nèi)容推薦,弱于執(zhí)行落地”的顯著特征。具體而言,產(chǎn)品在“活動及玩法推薦”、“路線推薦”等場景中表現(xiàn)較好,但在依賴實時數(shù)據(jù)與復(fù)雜決策的“出行方式推薦”環(huán)節(jié)存在明顯短板。在二級指標(biāo)層面,各產(chǎn)品在“需求理解”、“個人數(shù)據(jù)脫敏”等基礎(chǔ)維度得分較高,但在“多模態(tài)能力”、“輸出內(nèi)容體驗”等維度則有待提升。
與會專家認為,該評價體系的發(fā)布為產(chǎn)品優(yōu)化提供了明確方向,并為產(chǎn)業(yè)協(xié)同發(fā)展建立了共同語言。未來,北二外數(shù)字文旅研究中心計劃聯(lián)合產(chǎn)業(yè)各方,持續(xù)迭代優(yōu)化評價體系,定期發(fā)布行業(yè)評測報告,并建立產(chǎn)學(xué)研用協(xié)同創(chuàng)新機制,以推動AI旅行助手從“新奇工具”成長為值得用戶信賴的“智能旅行伙伴”。


































