史丹福大學人工智能研究所(Stanford HAI)發表在 2025 年《人工智慧指數報告》指,全球 AI 技術於過去一年內取得的多項里程碑,例如高端大型語言模型(LLM)的訓練成本於短短 18 個月內大幅下降 280 倍,而中美兩國在 AI 技術性能和開發能力方面的差距也顯著縮小。與此同時,企業投入創下新高,監管動作明顯加快,顯示人工智能不但已進入快速發展階段,更正成為國際科技競爭的核心戰場。
推理成本驟降 訓練支出激增
Stanford HAI 指出,雖然 OpenAI、Meta、Google 等科技巨頭在 AI 訓練上的總投入持續翻升,每家公司平均花費是前代模型的 28 倍,例如 Meta 就將其訓練費用由 300 萬美元升至 1.7 億美元(約港幣 HK$1.33 億升至 HK$13.26 億),但推理成本卻因硬件升級而急速下滑。從 2022 年底到 2024 年 10 月,一個擁有 GPT-3.5 水平(約 64.8% 準確度)的模型,其推理成本已從每百萬個 tokens 20 美元下降至 0.07 美元(約港幣 HK$0.55)。
成本顯著下降的背後,是小型 AI 模型能力持續進步,加上硬件價格下跌 30%、能效提升 40%。這些因素使普通用戶在使用 AI 工具時的經濟壓力大幅減輕,即使訓練成本仍然昂貴,但應用層面的門檻正不斷降低。
中國加緊追趕 美國仍佔領先
在 AI 模型開發方面,美國依然佔據主導。2024 年,美國機構推出 40 個具代表性的模型,遠高於中國的 15 個及歐洲的 3 個。然而中國模型在效能上已大幅追近。於 LMSYS Chatbot Arena 的盲測中,美國與中國頂級模型的得票率差距僅為 1.7%,主流基準測試如 MMLU、HumanEval 等的分數差距亦由雙位數縮窄至近乎持平。
中國在 AI 相關出版物及專利註冊上亦領先全球,顯示該國於技術深度與廣度兩方面同時增長。不單止中美兩強爭鋒,來自中東、拉丁美洲、東南亞等地區的新興開發者亦開始崛起,令全球 AI 生態日趨多極化。
AI 語言模型表現逼近人類水準
2023 年,研究界首次推出 MMMU、GPQA 和 SWE-bench 三項全新評估指標,分別針對多模態理解、專業知識問答及軟體工程問題處理能力,專門用以檢驗高階 AI 系統的極限。
短短一年後,人工智能模型的得分便錄得大幅增長:在 MMMU 測試中上升 18.8 個百分點,在 GPQA 上提升 48.9 個百分點,而 SWE-bench 更勁升 67.3 個百分點,顯示語言模型在綜合理解、領域專業知識與實用推理上迅速進步。
AI 系統在生成高品質影片方面亦表現驚人,除了能模擬自然語音與場景,更能維持視覺一致性與時間邏輯,朝向影像敘事能力邁進。部分語言代理模型甚至於編程時間受限的情境下表現超越人類開發者,顯示其不再僅限於支援工具角色,而是逐步具備執行複雜任務的能力。
投資金額創新高 企業全面擁抱 AI
報告顯示,美國於 2024 年的私人 AI 投資達 1,091 億美元(約港幣 HK$8,510 億),是中國 93 億美元(約港幣 HK$725 億)的近 12 倍。尤其生成式 AI 領域更吸引高達 339 億美元(約港幣 HK$2,644 億)的投資。這股熱潮亦反映在商業應用層面,有 78% 的企業於 2024 年導入 AI,遠高於前一年的 55%。
大量研究亦指出,AI 提升企業生產力,並能縮短技能差距,成為支援勞動市場轉型的重要技術。
有害事件增加 負責任發展任重道遠
隨著 AI 覆蓋領域日益擴大,相關風險亦逐漸浮現。AI 事件資料庫(AIID)在 2024 年接獲 233 宗與 AI 相關的有害或危險事件,數字遠超 2023 年的約 150 宗及 2022 年的約 100 宗。事件內容包括防盜 AI 誤將消費者視為竊賊、生成不雅深偽影像,以及聊天機器人鼓吹自殘等行為,部分企業甚至拒絕承擔責任或賠償。
目前,工業界在執行負責任 AI(RAI)評估方面仍明顯不足,儘管 HELM Safety、AIR-Bench、FACTS 等新指標提供了審視安全性與事實性的工具,但企業普遍未能有效應對風險。相對而言,政府層面行動更為積極,例如美國聯邦機構於 2024 年推行 59 項 AI 相關法規,是前一年的兩倍以上,而全球有 75 個國家的法規中出現 AI 用語,增幅達 21.3%。
教育與應用同步拓展 技術仍存邏輯瓶頸
AI 教育在全球亦見擴展,三分之二的國家已開設或計劃開設 K-12 電腦科學課程,為 2019 年的兩倍,非洲及拉丁美洲尤為顯著。然而,基礎設施落後仍限制不少地區學生接觸 AI 技術。在美國,雖有 81% 計算機教師認為 AI 應成為基礎教育一部分,實際具備授課能力的比例卻不到一半。
同時,報告指出,雖然部分 AI 系統在國際數學奧林匹克等比賽中表現出色,但於 PlanBench 等複雜推理基準中依然乏力,這限制其在精確性要求極高的場景中應用,例如醫療診斷與金融風控等。
未來關鍵:性能與信任並重
Stanford HAI 的執行總監 Russell Wald 指出:「AI 正快速改變整個文明架構,它的影響不限於任何單一行業,而是觸及每一個產業。」他認為,這份 AI 指數報告為政策制定者、學界及社會提供了理解未來方向的實證基礎,確保 AI 發展植根於以人為本的核心價值。
資料來源:Business Wire
分享到 :
最新影片
