AI在圍棋對弈、醫學研發等複雜領域中,屢次展現出超越人類的能力,但在簡單的日常任務上,機器仍面對挑戰。為了解決此一難題,專注於基盤模型和學習演算法開發的公司 Physical Intelligence,經過 8 個月的研究,推出一項汎用機械人基盤模型「π0」,目標是支援多種任務的機械人操作需求。今次他們就示範了利用機械人來摺疊衣服、執拾檯面、組裝箱子。
Physical Intelligence 表示,π0 是實現「人工物理知能(Artificial Physical Intelligence)」的首步,未來期望能如同現行大型語言模型(LLM)及聊天機械人助理般,讓機械人具備解決任意日常任務的能力。透過 π0,使用者將可要求機械人完成不同的指令任務。
π0 的設計理念不同於一般 LLM,除了基於文本及圖像資料的學習外,還加入機械人操作的實體體驗訓練。該模型可通過特有的新架構直接輸出動作指令,進而使機械人獲得一定程度的「物理知性」,更能有效應對多樣化的物理性操作需求。在展示影片中,π0 已展現多項家務工作的能力,包括打開洗衣機門、取出並折疊衣物,整理餐桌,甚至計量並研磨咖啡豆,以及組裝箱子等任務。
機械人從洗衣機收拾衣服:
機械人將洗衣機取出的衣服摺疊
機械人收拾桌面
機械人計量咖啡豆並移到咖啡機
機械人組裝箱子
這款 π0 原型模型經由開源數據集與來自8款不同機械人的資料訓練而成,涵蓋了多樣化的操作任務。其訓練數據選用了廣泛的物理互動資料,而非特定用途,目的是賦予模型廣泛的物理知識基礎,藉此奠定物理知能的第一步。
Physical Intelligence 認為,要真正實現這項技術的潛力,需要結合整個機械人社群的力量,並透露已經與多間企業和研究機構展開合作,期望能透過社群力量推動 π0 模型的進一步發展。
相關文章:
【教學】ChatGPT 視像隔空教你養魚 用相機攝取現場環境 實時 AI 回應用家問題 【教學】冗長文章 AI 變成有趣電台節目 Reader by ElevenLabs「聽」文章不再暈車浪 + 學習外語方便 【教學】MacWhisper 語音轉錄文字 AI 工具 本地 AI 模型處理 + 支援廣東話、多國語言 + 輸出字幕檔