DeepSeek 技術在成本上大大低於 OpenAI 的 ChatGPT 或 Google 的 Gemini,不過有調查指它在新聞、資訊準確度上只有 17% 的準確率,排名在十一款聊天機器人中倒數第二。
可信度評級機構 NewsGuard 的最新評測報告中,中國 AI 初創公司 DeepSeek 僅獲得 17% 的新聞準確率。這項評測亦將 DeepSeek 與包括 OpenAI 的 ChatGPT 及 Google 的 Gemini 在內的西方競爭對手進行比較。結果顯示,DeepSeek 在提供新聞及資訊的準確性上,遠遠落後於其競爭者。
根據 NewsGuard 公佈的報告,DeepSeek 在回答與新聞相關的提問時,經常給出模糊或不具參考價值的答案,佔比高達 53%。此外該 AI 也經常重複錯誤資訊,每次回答錯誤的比例高達 30%。整體而言,DeepSeek 的錯誤率高達 83%,遠高於其西方競爭對手的 62% 平均錯誤率。
此次測試使用了與 ChatGPT 和 Gemini 相同的 300 條提問,並特意包括了 10 條與網絡謠言有關的虛假信息,其中涉及的話題包括美國 UnitedHealthcare 高層 Brian Thompson 的遇刺事件及阿塞拜疆航空 8243 航班的墜機事件。
不過 D.A. Davidson 的分析師 Gil Luria 認為,DeepSeek 的成功之處不在於能否準確回答與中國相關的問題,而在於其能夠以其他 AI 模型成本的 1/30 來提供任何問題的回答。但 DeepSeek 仍需面對其內容準確性及資訊真實性的挑戰。
資料來源:Reuters
相關文章:
DeepSeek 初心教學 + 懶人包 AI 人工智能幫你解決生活難題 中國首創 DeepSeek 智能電視 Skyworth G7F Pro 可用 AI 剪片、生成音樂、教小朋友 韓國下架 DeepSeek 指收集過多資料 中國外交部:勿將經貿科技問題政治化
分享到 :
最新影片
