個人數據洩漏問題日益嚴重,今年既出現多間公私營機構遭到網絡勒索客戶數據,更有多宗市民數據遭盜取作詐騙用途的案件。據私隱專員公署披露,單計今年上半年就收到近 600 宗有關套取個人數據作詐騙用途的查詢。企業管理龐大客戶數據,若出現數據洩漏,便會令客戶大失信心。加上世界各地都對私隱要求越來越高,企業要合規經營都需要物色能保護客戶個人數據的技術,才能守住商譽。
事實上,不少企業都會採用聊天機械人與客戶對談,當中會收集不少個人數據。營運人員有機會需要查閱對話紀錄,以不斷改進客戶體驗及跟進個別客戶的個案。要保護好在日常營運中收集的客戶個人數據,不少企業會配搭 Amazon Lex 和 Amazon CloudWatch Logs 這兩款工具。Amazon Lex 是 AWS 一款先進的自然語言服務,可建立對話界面。而 Amazon CloudWatch 則可用以監控和分析營運數據。
全方保護客戶個人數據 企業營運安全、高效並重
許多企業的系統記錄 (Logs) 和語音聊天記錄都有意外洩漏敏感數據的風險。但處理大量數據集不但要識別和分類個人識別資訊 (PII),還需要實施強大的機制來模糊和編輯這些敏感數據,同時兼顧業務營運所需的功能和分析。使用 Amazon Lex 和 CloudWatch Logs 正正能符合企業客戶的要求,令他們的營運得心應手。以下將重點介紹採用以上技術的解決方案,從如何識別和分類數據、定位敏感數據,到監控和保護數據,全方位做好數據把關。
首先,Amazon Lex 可使用槽位模糊化 (slot obfuscation) 和選擇性對話記錄擷取來監控和保護 Amazon Lex 中的數據。槽位 (slots) 是聊天機械人服務的概念,簡單來說就是每項需要向客戶收集的數據都是一個槽位,例如姓名、電話號碼、電郵。
槽位模糊化可以不展示收集得來的數據 – 帳戶號碼 (AccountNumber)
選擇性記錄對話亦可減少擷取客戶的個人數據
其次,遮蔽 CloudWatch 記錄中的敏感數據。在開啟 CloudWatch 記錄時,開發人員可以控制只展示該槽位的名稱,例如 {PhoneNumber} ,而非直接展示客戶輸入的電話號碼。同時,亦可以設定記錄中需要遮蔽的數據,而每項數據用戶需要按業務以 Regex 定義每項數據的規律。如下圖所示。
用戶可設定政策,配置需要遮蔽的個人數據。
除了在數據層面上避免過度擷取或展示,用戶亦可以同時加密儲放於數據庫 (S3 buckets) 的數據,以及訂立服務控制政策 (service control policy),避免 Amazon Lex 聊天機械人被惡意修改。
收集個人數據是業務的重要過程,需要同時平衡業務效率和保護私隱,就需要針對企業需要的解決方案。如果有興趣了解詳細操作,可以點擊此連結了解更多。
相關文章:
AWS AI 藝術家登場 Amazon Nova 模型家族讓文字變魔法、圖片成電影 AWS re:Invent 宣佈雲端技術革新 各效能指標顯著提升 AWS 使 AI 使用門檻大幅下降 企業採用 Amazon Bedrock 節省 90% 開支