近日,小鵬機械人產品總監施曉鑫在一場全球記者交流會中詳細介紹了小鵬在開發自家 IRON 人形機械人的最新進展以及回應了一系列現場記者的提問。來到 2025 年的今日,這些技術不再只存在於科幻電影之中,而是已經實際應用在小鵬廣州的工廠、總部辦公室接待處及零售門市,機械人為人類服務的時代已經越來越近。

機械人產業在中國具優勢 供應鏈體系成熟完善
事實上,「人形機械人」的概念早在多年前便已出現,小鵬機械人產品總監施曉鑫指出真正的技術突破,是在近年大型語言模型(LLM)出現之後才逐漸實現。過去工程師必須透過大量程式編寫,逐條設計規則,教導機械人完成任務。如今透過大數據與 AI 模型的訓練,機械人已能自行學習並執行多樣化的工作,令整個行業發展大大加快。
中國在發展人形機械人方面具備多項優勢。以深圳、廣州與上海為中心的供應鏈體系成熟完善,相關零件、模組與硬件設備均能就地採購。其次,地方政府及中央層面的政策支援,整體研發與執行效率遠高於其他地區。小鵬目前已在自家工廠與總部部署多部名為「IRON」人形機械人,讓其於真實場景中進行訓練與工作。團隊強調,必須透過真實任務來收集數據,才能有效提升機械人的表現。他們主要收集兩種資料:一是人類在該場景中完成任務的方式,二是機械人在相同條件下的表現。透過對比與優化,團隊才能不斷改進演算法與控制系統。
▲IRON 人形機械人跟人類一樣具備大腦、小腦、眼睛及嘴巴,大腦採用圖靈AI 晶片及天璣 OS,負責深度思考和決策,而小腦則負責執行與強化學習,眼睛(攝像頭及 AI 鷹眼視覺)負責感知,而嘴巴則用作語音對話。
為何要把機械人做成「人形」?
不少人會問:為甚麼機械人需要模仿人類外形? 施曉鑫指最大原因在於我們日常操作的工具與工作方式本身就是為人類身體結構設計,若要機械人真正融入現實場景並執行複雜任務,它的體型、關節與視覺設計便必須接近人類,才能適應既有的空間與工具。我們讓機械人看起來像人類、是因為希望能利用人類的數據來訓練機械人,只有當機械人的身體比例與人類一致,移動方式類似,眼睛(傳感器)位置也相若時,從人類身上收集到的數據才更有用、更容易訓練模型。此外,我們發現機械人的價值主要來自「雙手」,而非「雙腳」,所以我們將焦點由動作回到雙手的功能,這將會是我們的核心發展方向,務求讓它真正變得有用。
▲XPENG IRON 是市場上其中一款最擬人設計的人形機械人,身高 178cm、體重 70kg 擁有真人比例的體型,1:1 雙手尺寸擁有 22 個不同自由度,此外,IRON 的行走姿態亦與真人相同。
▲人形機械人是一項難度系數極高的軟硬件工程,硬件方面的難度依次序為: 關節 > 腳 + 腦幹 > 耳朵+ 嘴巴 > 眼 > 手。而 AI 科技的突破難度則是小腦(控制腳步) > 小腦(控制手部) > 大腦(控制全身)。
小鵬人形機械人的開發目標是打造一款「通用型」機械人—能夠像人類一樣,在不同場景中學習與執行多樣任務。例如在工廠中,機械人既可負責裝配螺絲與零件,又能擔任保安工作,甚至擔任接待人員與顧客互動。在機械人能力穩定之前並不會真正去取代工人。他估計在未來兩至三年內,有可能會逐步取代部分工序但不是整個職位。舉例說,或許會取代一位前線工人約一半的工作量。
▲自 2017年完成第一代四足機械人研發,至 2022 年已經完成第五代四足機械人及 PX2 機械臂。
▲2023年 10 月第一部人形機械人 PX5 登場與下圖的小鵬鵬行智慧機械人。
相關文章:
【教學】免費圖片變影片 AI 免 VPN、電腦手機都玩到 【教學】AI speaker 免費 AI 生成語音工具 AI 代你講嘢、支援廣東話語音 自帶 AI 的 PDF 文件工具《UPDF》教學 必用 9 大功能:AI 總結內容、翻譯、PDF 編輯、加簽名、轉TXT檔
機械人的智能分級與未來目標
小鵬將機械人智能劃分為五個層級 — 第一級 L1 為全人手操作,第二級 L2 為部分自動化,例如能自行走到指定位置。第三級 L3 則是現階段的發展重點:機械人具備執行任務的能力,但仍需人類監控,亦即所謂的「嵌入式智能」。至於第四級 L4 與第五級 L5,分別對應幾乎完全可靠的自主工作與能夠自學新技能的機械人,目前仍需多年時間方能實現。施曉鑫預期,在三至五年內能推出 L3 智能機械人,並持續提升應對複雜任務的能力。除了演算法與數據外,硬件發展亦是關鍵。
▲機械人的智能化程度跟自動駕駛十分相似,L1 沒有自由控能力需要完係全由人類控作,L2 基礎輔助智慧,需要高度人工控制,L3 具身智慧需中度人工控制,L4 自成長智慧,只需輕度人工控制,而 L5 完全自主則不需要人工控制。現時的人形機械人量產目標均以 L3 為主,在不同場景下能夠經訓練後獨立運作,在部份情況會尋求人工監督。
機械人有「靈魂」可能威脅人類嗎?
在分享中有記者問及「小鵬希望為機械人注入靈魂是什麼意思?」施曉鑫指出,過往的 AI 主要以資訊查詢為主,但今天的新一代語言模型不僅能回答問題,更能主動推理、創造與回應,呈現出某種思維方式。若機械人能透過學習掌握新技能,並能獨立處理問題,這樣的「自我意識」與學習能力,便是開發者所說的「靈魂」。
針對像 Terminator、RoboCop 等電影橋段機械人可能構成人類威脅的擔憂,施曉鑫認為目前言之過早。現階段的機械人仍處於基礎能力建構階段,主要挑戰在於如何提升穩定性而非過早地限制發展,就以機械人手指活動的靈活性為例便是研發上最複雜的地方。現在開發團體更加關心如何令機械人行走時不會跌倒、操作工具時不會失誤,透過加強學習方式進行訓練提升成功率。未來,小鵬亦會在系統中加入更多限制機制以防不受控行為,但現階段最重要的確保機械人本身的可操作性,而非擔心機械人是不是會威脅人類。
▲人類社會物理環境大部份為「手操作」而設計,不說不知原來人形機械人最大的挑戰不是行路不是跳舞,而是比穩定地行走更難的是手部的靈活操作,如何做到精細化抓取物件和操作,同時可以感知不同重力和材料的變化,手部靈活程度直接影響未來商業化潛力,舉行例子需要機械人拿起雞蛋、操作螺絲批上螺絲等看似簡單的動作,暫時都是機械人的大挑戰。

距離進入家庭生活服務還有多遠?
當被問到人形機械人何時能進入一般家庭,施曉鑫回應,現時應用場景仍以工廠、商業大樓與門市為主,主要考慮到家庭環境的複雜性與安全性。預計要讓機械人普及至家居層面,仍需五至十年時間。目前來看,機械人的工作效率大約只有人類的十分之一或二十分之一左右,這是以操作任務層面衡量,不過肯定的是未來效率將會逐步提升。

至於售價方面,施曉鑫表示現在仍不是討論價格的時機,在中國要將一項產品變得便宜並不困難,關鍵是量產與產品本身的設計。若機械人最終能進入家庭,其價格必定會低於一輛汽車,甚至比一部小型車更便宜。中國在控制成本與量產能力方面具備優勢,價錢相信不會成為機械人普及的最大障礙。
相關文章:
【教學】免費圖片變影片 AI 免 VPN、電腦手機都玩到 【教學】AI speaker 免費 AI 生成語音工具 AI 代你講嘢、支援廣東話語音 自帶 AI 的 PDF 文件工具《UPDF》教學 必用 9 大功能:AI 總結內容、翻譯、PDF 編輯、加簽名、轉TXT檔
分享到 :
最新影片
