百度於Create 2025開發者大會上發布了一系列重磅AI技術成果,涵蓋文心大模型4.5 Turbo與X1 Turbo,以及高說服力數碼主播技術,彰顯其在人工智能領域的技術領先與商業化落地能力。百度創始人李彥宏在會上強調,AI應用需找對場景、選對模型並善於調優,方能創造持久價值並滲透更多行業場景。
文心大模型4.5 Turbo與X1 Turbo:性能與成本雙突破
百度此次發布的文心大模型4.5 Turbo與X1 Turbo,針對當前大模型普遍存在的模態單一、幻覺高、速度慢及成本昂貴等問題,提供了全面解決方案。文心4.5 Turbo強化多模態能力,支援文本、圖像等多模態輸入,基準測試平均分達77.68,超越GPT-4o的72.76。相較前代文心4.5,其推理速度顯著提升,輸入價格降至0.8元/百萬token(降幅80%),輸出價格為3.2元,僅為DeepSeek-V3的40%。
李彥宏指出,多模態模型將成為未來主流,純文本模型市場將逐步萎縮。 文心X1 Turbo則是基於4.5 Turbo的深度思考模型,進一步增強思維鏈能力,問答、創作、邏輯推理及工具調用表現更優,整體性能領先DeepSeek R1與V3最新版。其價格更具競爭力,輸入價格1元/百萬token,輸出價格4元,僅為DeepSeek-R1的25%。
李彥宏表示,通過優化模型結構與訓練方式,百度實現了性能提升與成本降低的雙贏,為開發者提供了更具性價比的選擇。 針對業界對模型迭代過快導致應用過時的擔憂,李彥宏強調,只要選對基礎模型並善於微調,應用即可保持長期競爭力。百度還計劃通過開源與API服務,進一步降低開發者門檻,推動AI技術在教育、醫療、金融等領域的滲透。
高說服力數碼主播:超擬真體驗重塑直播生態
百度慧播星平台推出的高說服力數碼主播成為大會另一亮點。該技術依托文心大模型的劇本生成與多模驅動能力,實現數碼主播在表情、語氣、動作及情緒轉換上的超擬真表現,超越傳統真人主播體驗。用戶僅需錄制2分鐘直播視頻,即可通過“一鍵克隆”功能生成專屬數碼主播,極大降低了內容創作門檻。 數碼主播內置“AI大腦”,能根據直播間實時熱度與轉化數據,動態調整互動策略。例如,系統可適時切換鏡頭、調用圖片或視頻素材,甚至靈活調度助播、場控等角色,實現“一人即營銷團隊”的高效運營模式。在電商直播、遊戲推廣及消費品營銷等場景中,數碼主播展現出巨大商業價值,助力企業提升轉化率與用戶黏性。 百度慧播星的技術突破得益於其多模態模型的深度整合。通過結合語音合成、動作捕捉及情感計算,數碼主播不僅能模擬真人口播效果,還能根據場景需求生成專業化內容。例如,在電商直播中,數碼主播可根據商品特點自動生成吸引人的口播腳本,並通過自然的情緒表達提升觀眾購買意願。
行業影響與未來展望
百度Create 2025大會的技術發布反映了中國AI行業的快速進展。根據CNBC報導,中國科技巨頭如百度、阿里巴巴近期密集發布AI更新,顯示出中國在大型語言模型與多模態技術上的競爭加劇。百度此次推出的低成本模型與數碼主播技術,有望進一步推動AI應用在中小企業中的普及,降低技術採用門檻。 然而,百度也面臨國際競爭與地緣政治挑戰。美國近期對50餘家中國科技公司實施出口限制,試圖遏制中國在AI與高性能計算領域的發展。儘管如此,百度通過自主研發與成本優化,展現了在全球AI賽道中的強大競爭力。 李彥宏在會上展望,隨著多模態模型與數碼主播技術的成熟,AI將更深入地融入日常生活中,從智能客服到虛擬教育,再到沉浸式娛樂,應用場景將無處不在。百度計劃在未來數年持續迭代文心大模型,並擴展慧播星在全球市場的應用,與開發者共同探索AI驅動的商業新模式。 結語 百度Create 2025大會不僅展示了文心大模型4.5 Turbo與X1 Turbo的技術領先性,也通過高說服力數碼主播技術開辟了AI應用新賽道。這些突破為開發者提供了更高效、更低成本的工具,同時為電商、娛樂等行業注入了新動能。隨著百度在AI生態的持續布局,其技術成果有望在全球範圍內推動產業升級與創新。
分享到 :
最新影片
