xAI 旗下人工智能聊天機械人 Grok 推出全新功能,新增視覺辨識及多語言語音支援。Grok Vision 容許用戶透過 iOS 應用程式以智能手機攝影機掃描物件,如產品、標籤或文件,並即時提出問題。同時,Grok 的語音模式新增實時搜尋及多語言功能。
Grok Vision 功能讓用戶可利用手機攝影機即時辨識周圍環境,與 Google Gemini 及 ChatGPT 的實時視覺功能相媲美。例如用戶可掃描商品條碼查詢價格,或拍攝路牌獲取導航資訊。Grok Vision 功能現僅限 iOS 平台,xAI 表示將於未來數月擴展至 Android。
Grok 的語音模式新增多語言支援,包括印度語,方便不同地區用戶。實時搜尋功能則允許用戶以語音查詢即時資訊,惟此功能需訂閱 SuperGrok 計劃。 xAI 強調,功能可提升用戶互動體驗,並計劃優化語音辨識準確度。
Grok 於本月早前新增記憶功能,記錄過往對話細節,提供更個人化的回應。此外 Grok Studio 工具亦於 4 月 16 日推出,支援用戶建立文件、程式碼及瀏覽器遊戲,並整合 Google Drive 功能,方便上傳文件。工具對免費及付費用戶均開放,大幅提升 Grok 的實用性。
Grok 的快速更新顯示 xAI 致力追趕 OpenAI 及 Google 等競爭對手。隨著視覺及語音功能的推出,Grok 有望在人工智能市場佔據更大份額。未來數月 xAI 或將推出 Android 版 Grok Vision,並擴展多語言支援,特別針對亞洲市場本地化需求。
資料來源:Tech Crunch