人工智能

95後「AI天才少女」羅福莉 正式宣佈加入小米 全力開發 AGI

Published by
Lawton

前 DeepSeek 研究員、有「AI 天才少女」稱號的羅福莉近日證實加入小米,並在社交平台發文表示:「智慧終將從語言邁向物理世界。我正在 Xiaomi MiMo,和一群富有創造力、才華橫溢且真誠熱愛的研究員,致力構建這樣的未來,全力奔赴我們心目中的 AGI」,正式回應早前有關她轉投小米的傳聞。AGI:(Artificial General Intelligence)即通用人工智能,是指能像人類一樣學習、理解和解決各種問題的 AI 系統。與現時專注單一任務的 AI 不同,AGI 可跨領域自主學習,具備推理、創造和情境理解等人類認知能力,目前仍屬理論階段。

Xiaomi MiMo 是小米首個推理大模型團隊,羅福莉加入標誌著小米在 AI 大模型領域的戰略佈局進入新階段。

 

 

千萬年薪傳聞與實際情況

今年 2 月曾有傳媒報導指小米集團董事長雷軍以 1,000 萬人民幣(約港幣 1,080 萬元)年薪招攬羅福莉,領導小米 AI 大模型團隊。不過當時小米和羅福莉本人均未回應此事,羅福莉更曾發帖表示:「請互聯網還我一片安安靜靜做事的氛圍吧,我不是天才少女,只想安安靜靜做難而正確的事情」。直至今年 10 月,小米 AI 團隊與北京大學聯合發表一篇聚焦 MoE 與強化學習的論文,當中已出現羅福莉的名字,顯示她已開始以小米身分參與研究工作。

 

羅福莉的研究背景

現年約 30 歲的羅福莉本科畢業於北京師範大學電腦專業,碩士階段進入北京大學計算語言學深造。她在北京大學讀碩士期間,於 2019 年在人工智能領域頂級國際會議 ACL 上發表 8 篇論文,當中 2 篇為第一作者。碩士畢業後,羅福莉加入 Alibaba 達摩院擔任機械智慧實驗室研究員,負責開發多語言預訓練模型 VECO,並推動 AliceMind 項目的開源工作。

 

2022 年羅福莉加入 DeepSeek 母公司幻方量化從事深度學習相關工作,後來擔任 DeepSeek 深度學習研究員,參與研發 DeepSeek-V2 等模型。DeepSeek-V2 採用混合專家架構(Mixture-of-Experts,MoE),總參數量達 2,360 億,但每個 token 僅啟動 210 億參數,與 DeepSeek 670 億模型相比,訓練成本節省 42.5%,KV cache 減少 93.3%,最大生成吞吐量提升 5.76 倍。該模型在數學推理和程式碼生成方面表現優異,被業界稱為「性價比之王」,價格僅為 GPT-4 的 1/100。

 

 

小米的 AI 戰略佈局

小米在 2023 年 4 月成立 AI 實驗室大模型團隊,今年 4 月正式發表首個開源 AI 大型語言模型 MiMo。MiMo-7B 系列包含 4 個版本,參數規模為 70 億,在數學推理和程式碼競賽測評中,表現超越 OpenAI 的閉源推理模型 o1-mini 及 Alibaba Qwen 的開源推理模型 QwQ-32B-Preview。該模型採用三階段預訓練流程,累計訓練 25 萬億 tokens 數據,當中合成約 2,000 億 tokens 推理專用數據。

 

據報導小米公司正積極搭建 GPU 萬卡集群,以加大對 AI 大模型的投入力度。小米大模型團隊在成立之初已擁有 6,500 張 GPU 資源,今次搭建 GPU 萬卡集群將進一步提升小米在 AI 大模型領域的研發實力。知情人士透露該計劃已實施數月,雷軍在當中擔當重要領導角色,他對 AI 硬件的重視程度極高,認為手機是 AI 硬件領域的核心,小米必須全力以赴。

 

雷軍曾於去年 8 月的演講中宣佈小米進行科技戰略升級,把 AI 放到核心位置,並提出「深耕底層技術、長期持續投入、軟硬件深度融合,AI 全面賦能」的原則。小米宣佈 2025 年研發投入將超過 300 億人民幣(約港幣 324 億元),當中四分之一(約 75 億人民幣,約港幣 81 億元)專門用於 AI 領域。雷軍亦公佈更長遠的投入計劃:2021 至 2025 年研發投入預計超過 1,000 億人民幣(約港幣 1,080 億元),2026 至 2030 年將超過 2,000 億人民幣(約港幣 2,160 億元),主要聚焦於 AI、作業系統、晶片三大底層技術。

 

從語言到物理世界的 AI 應用

羅福莉在朋友圈配圖中包括她在內共 40 人同框,顯示小米已為 MiMo 大模型組建一個規模可觀的研究團隊。隨著羅福莉加入,擁有龐大硬件生態的小米正進一步強化其作為 AI 從語言世界邁向物理世界的關鍵試驗場地位。小米計劃將強大的 AI 技術如 MiMo 整合到整個生態系統中,令手機更智能(HyperOS)、改善小愛助手、實現智能家居,以及為即將推出的電動車提供技術支援。

 

 

資料來源:聯合報

 

Published by
Lawton