OpenAI 最新推出 AI 模型 GPT-5 首日即遇多項技術問題,用戶反應兩極。行政總裁 Sam Altman 昨日於 Reddit 問答環節承認推出過程「比預期顛簸」,承諾將讓 Plus 付費用戶繼續使用舊版 GPT-4o 模型。
自動路由器故障導致表現下降
Altman 在 Reddit AMA 解釋,GPT-5 首日表現欠佳主因新功能實時路由器故障。此路由器負責按用戶查詢複雜程度,自動決定使用哪個模型回應或是否需要額外時間「思考」答案。
「GPT-5 從今天起會顯得更聰明。昨日我們遭遇嚴重問題,自動切換器部分時段無法運作,結果令 GPT-5 顯得笨拙許多」,Altman 承諾改善決定邊界運作方式,讓用戶更常獲得正確模型,同時更清晰顯示哪個模型正在回應查詢。
用戶強烈要求恢復 GPT-4o
多名用戶於 Reddit 討論區抱怨 GPT-5 表現遜於前代 GPT-4o 模型,指新模型回應過短、缺乏個性,且付費用戶易達使用限制。部分用戶形容 GPT-5 推出是「徹底災難」,指「訊息串流錯誤」問題中斷每段對話,令調試軟件難以實行。
面對用戶強烈反對,Altman 承諾研究讓 Plus 用戶繼續使用 4o 模型可行性:「我們正研究讓 Plus 用戶持續使用 4o。嘗試收集更多取捨數據」。OpenAI 同時承諾為完成推出流程 Plus 用戶倍增使用限制,讓用戶試用學習新模型,適應不同使用情境而無須憂慮耗盡每月查詢次數。
直播演示圖表錯誤成為笑柄
除技術問題外,OpenAI 於 GPT-5 直播發布會展示圖表出現明顯錯誤,迅速成為網上「圖表犯罪」笑話對象。其中比較 GPT-5 與 o3 模型「編碼欺騙」指標表現圖表,GPT-5 欺騙率 50% 對應柱狀圖竟比欺騙率 47.4% 的 o3 模型更短。
Altman 在 X 平台稱此圖表錯誤為「超級圖表搞砸」:「數字準確但我們直播前夕搞砸柱狀圖;另張幻燈片也弄錯數字。團隊熬夜工作極度疲倦導致人為錯誤。多項元素在直播前最後數小時匯聚」。
市場反應與競爭壓力
早期用戶對 GPT-5 反應普遍冷淡。AI 影響者兼前 Google 員工 Bilawal Sidhu 於 X 平台民調顯示,172 票中主流意見認為 GPT-5「有點中庸」。數據科學家分享截圖顯示 GPT-5 在簡單數學證明與基礎代數問題出現錯誤。
這次推出問題令 OpenAI 面臨重大挑戰,公司正面對 Google、Anthropic 等美國競爭對手及中國開源 AI 模型日趨激烈競爭。有博彩市場預測 Google 可能 2025 年 8 月底前擁有最佳 AI 模型。
雖面對初期挑戰,Altman 承諾持續穩定系統並聆聽用戶回饋:「我們會持續努力穩定情況,並恆常聆聽回饋」,他在 AMA 結束時強調。
資料來源:TechCrunch
分享到 :
最新影片
