像 Amazon Alexa 等的智能語音產品逐漸流行,但背後的私隱問題亦引起關注。最近更有報導指,部分 Alexa 的錄音會被內部員工收聽,以助訓練演算法,改良產品的準確度。
彭博訪問了七位曾參與相關計劃的員工,指 Amazon 有全職員工和承包商在波士頓、哥斯達黎加、印度和羅馬尼亞等地進行人工語音分析,每人每日需工作 9 小時,並最多分析 1,000 條語音檔案,將內容轉錄、注釋並傳送至軟件之中,讓 Alexa 更有效回應用戶的指令。
人工分析語音檔案的目的有多種。其中一個員工指,他需要在語音尋找特定的詞語,例如「Taylor Swift」,並作出注釋以表示用戶在搜尋音樂藝人。有時候當他們無法確定用戶的話語,或者找到一些「有趣」的錄音時,便會用到內部聊天室分享檔案。
有時候他們亦會聽到一些涉及犯罪的錄音,不過當他們向 Amazon 尋求協助時,公司稱 Amazon 不便干涉。彭博亦指出,部分外語與用於喚起語音裝置的詞語「Alexa」或「Echo」相似,例如法語「avec sa」和西班牙語「Hecho」,這都需要人工協助來改良演算法。
事實上,Amazon 已在產品的常見問題清單中表明,他們會用到用戶的語音指令來訓練產品的語音識別和自然語音處理系統,唯沒有明確指出語音會被人工收聽;而即使用戶選擇取消將語音給 Amazon 分析以助開發新功能的選項,Amazon 亦有可能會檢視該語音檔。
Amazon 回覆彭博時表示,他們非常重視用戶資料的安全和私隱,只會注釋極少數的語音內容以改善客戶體驗,及訓練其語音識別和自然語音認知系統。他們又指,Amazon 有嚴格的技術和操作保障,並對濫用系統的員工零容忍。員工無法直接存取可識別用戶的資料,而所有資料都會以機密處理,並會使用多重新身認證限制數據存取。
資料來源:Bloomberg