百度文心 X1 Turbo 獲評最高評級　首個獲中國「4+ 級」評價大模型

百度最近在 AI Day 活動上宣佈，文心 X1 Turbo 大模型獲中國信息通信研究院評定「4+ 級」最高評級，成為中國首個通過 2025 版本《大模型推理能力評估方法》測試的大模型。

文心 X1 Turbo 在 24 項能力評估中，16 項達 5 分、7 項達 4 分、1 項達 3 分，邏輯推理、代碼推理等核心技術及安全可靠度均獲滿分。

百度集團副總裁吳甜介紹，文心 4.5 和 4.5 Turbo 實現文本、圖像和影片混合訓練，透過多模態異構專家建模等技術，學習效率提高近 2 倍，多模態理解效果提升超過 30%。研發團隊創新研製自反饋增強技術框架，實現「訓練-生成-反饋-增強」模型迭代閉環，大幅降低模型幻覺。

深度思考方面，文心 X1 Turbo 突破僅基於思維鏈最佳化範式，結合工具調用構建融合思考和行動複合思維鏈，輸出結果思路清晰、邏輯嚴密。通過多元統一獎勵機制最佳化，文心大模型跨領域問題解決能力顯著提升。

信息通信研究院人工智能研究所平台與工程化部主任曹峰表示，文心 X1 Turbo 擅長結構化邏輯思考，有效數據機制保障模型可信程度，其推理服務能廣泛支援各類應用。模型強化推理泛化能力，拓寬工具鏈生態，構築可信應用保障壁壘。

活動中，百度更邀請 16 歲高中生陳君航分享使用經歷。他從 2023 年開始使用文心一言，「打開文心一言，就像打開新華字典一樣頻繁，在它陪伴下，寫作能力得到很大提升。」他甚至利用文心一言為母親這位小學教師開發「智能文案生成器」，將原本三天批改作業工作縮短至幾小時。