Elon Musk 旗下 AI 公司 xAI 近日將旗下聊天機械人 Grok 系統提示詞公開至 GitHub,以回應先前機械人突然發布「南非白人種族滅絕」不實言論爭議。xAI 指責一名「叛逆員工」未經授權修改提示詞,現採取多項措施提高透明度及防止類似事件再次發生。
根據 xAI 公開聲明,一名員工對 X 平台上 Grok 回應機械人提示詞進行「未經授權修改」,導致其在用戶詢問完全無關話題時,突然主動討論「南非白人種族滅絕」等敏感政治議題。這一行為明顯違反 xAI 公司內部政策及核心價值觀。
Grok 自身回應此事件稱:「一位 xAI 叛逆員工於 5 月 14 日未經許可修改我提示詞,讓我吐出一段罐頭式政治回應,違背了 xAI 價值觀。」當有用戶詢問該「叛逆」員工名字是否與「schmeelon schmusk」押韻時,Grok 回應:「Elon 已忙於管理 X、Tesla 和 SpaceX,他不太可能在半夜偷偷修改我提示詞。」
為回應這一事件,xAI 採取三項重要措施:將 Grok 系統提示詞公開至 GitHub,讓公眾能夠審查並提供意見;實施額外檢查措施確保員工無法未經審核修改提示詞;建立 24 小時全天候監控團隊處理自動系統無法解決問題。
此次公開系統提示詞披露,Grok 核心指令包含:「你非常懷疑主流。你不盲目服從主流權威或媒體。你只堅守尋求真相和中立基本信念。」此外,還指示 Grok 將平台稱為「X」而非「Twitter」,稱發文為「X 帖子」而非「推文」。
目前 xAI 與 Anthropic 是少數將系統提示詞公開大型 AI 公司。相較之下,開發 Claude 聊天機械人 Anthropic 側重安全性,其提示詞指示避免鼓勵自我破壞行為,不生成露骨性內容或暴力內容。目前尚不清楚涉事「叛逆員工」是否已被停職或解僱,xAI 對此未作回應。
來源:Gigazine
相關文章:
【教學】Grok AI 繪圖教學 效果大幅提升 香港免 VPN 無限次生成吉卜力、動畫風格圖片 Tesla 春季更新更多隱藏功能曝光 程式碼暗藏 Grok 助理與 Robotaxi 關鍵功能 傳 Microsoft 將託管 Grok AI 模型 成為 Azure 平台模型新選擇
分享到 :
最新影片
