百度最近在 AI Day 活動上宣佈,文心 X1 Turbo 大模型獲中國信息通信研究院評定「4+ 級」最高評級,成為中國首個通過 2025 版本《大模型推理能力評估方法》測試的大模型。
文心 X1 Turbo 在 24 項能力評估中,16 項達 5 分、7 項達 4 分、1 項達 3 分,邏輯推理、代碼推理等核心技術及安全可靠度均獲滿分。
百度集團副總裁吳甜介紹,文心 4.5 和 4.5 Turbo 實現文本、圖像和影片混合訓練,透過多模態異構專家建模等技術,學習效率提高近 2 倍,多模態理解效果提升超過 30%。研發團隊創新研製自反饋增強技術框架,實現「訓練-生成-反饋-增強」模型迭代閉環,大幅降低模型幻覺。
深度思考方面,文心 X1 Turbo 突破僅基於思維鏈最佳化範式,結合工具調用構建融合思考和行動複合思維鏈,輸出結果思路清晰、邏輯嚴密。通過多元統一獎勵機制最佳化,文心大模型跨領域問題解決能力顯著提升。
信息通信研究院人工智能研究所平台與工程化部主任曹峰表示,文心 X1 Turbo 擅長結構化邏輯思考,有效數據機制保障模型可信程度,其推理服務能廣泛支援各類應用。模型強化推理泛化能力,拓寬工具鏈生態,構築可信應用保障壁壘。
活動中,百度更邀請 16 歲高中生陳君航分享使用經歷。他從 2023 年開始使用文心一言,「打開文心一言,就像打開新華字典一樣頻繁,在它陪伴下,寫作能力得到很大提升。」他甚至利用文心一言為母親這位小學教師開發「智能文案生成器」,將原本三天批改作業工作縮短至幾小時。
相關文章:
百度蘿蔔快跑無人車測試擴展至東涌 凌晨至夜間行駛 每次 3 輛測試車上路 百度李彥宏狠批 DeepSeek 又貴又慢有幻覺 掀中國 AI「內捲」口水戰
分享到 :
最新影片
