Google 5 月 17 日起正式對旗下 Gemini 的用量計算方式作出重大變更,由原本按每日請求次數計算,改為按運算資源消耗量計費,涉及提示詞複雜程度、使用功能及對話長度等因素。所有用戶每五小時面臨一次限流重置,一旦用盡便會被強制切換至效能較差的低階模型。大量用家表示不滿,有人在社交平台形容新制度「完全是詐騙」,亦有人說即時取消訂閱,認為破壞用戶體驗。,直接衝擊專業用戶日常工作流程。新計算法導致配額消耗速度遠超預期,有用家僅進行五輪對話便耗盡半數額度,引發大量付費用戶揚言取消每月價值約港幣 HK$156 的 AI Pro 訂閱計劃。

▲ 所有用戶每五小時面臨一次限流重置,一旦用盡便會被強制切換至效能較差的低階模型
用戶批評改用量計法不透明
新制度下 Gemini 改為按每次提示詞複雜程度、功能及對話長度計算用量,並且每隔 5 小時便會重置用量,直至達到每週用量上限。若然用盡 5 小時計算額度,用家將會暫時面臨「停賽」,直至 Google 重設 5 小時配額。各訂閱計劃用量上限亦有分別:AI Plus 用家享有標準上限 2 倍配額,AI Pro 用家為 4 倍,AI Ultra 則高達 AI Pro 5 至 20 倍。
不過用家平日使用 Gemini 時,不論是展開全新對話還是延續舊有對話,皆會因內容與提示詞複雜程度不同,導致 Token 消耗情況各有差異。很多用家均感受到 Token 消耗速度遠超以往。有網民在 Reddit 表示,僅與 Gemini 進行 5 輪來回對話便耗盡 50% 使用配額,隨即憤而取消 AI Pro 訂閱。另有網民形容新制度為「totally scam(完全是詐騙)」,因為單次普通文字提示已耗用 13% 配額。

▲網民在 Reddit 形容新限制毀了 Gemini
網民批評 Gemini 用量高峰期自動切換低階模型
除了面對用量計算問題,有外國用家指出 Gemini 在用量高峰期會自動切換至較低階 Flash 模型,即使選用 Pro 模型亦不能倖免。另有網民指出啟用「個人化智能」功能亦會顯著加速消耗額度。
Google 基本上沒有大肆公布上述變動,僅得部分訂戶收到 Google 電郵通知用量計算方法變更。大部分用家皆未收到通知,更令廣大用家深感不滿。
Claude 早已實行同類額度限制
對於曾使用過 Claude 的用家而言,對每 5 小時計算用量及每週上限應不陌生。Gemini 目前亦引入同類制度,隨着對話串長度增加,Token 消耗量亦會大幅遞增。為了節省 Token 運算用量,Claude 用家過往會在來回對話達一定長度時展開新對話,甚至將附件轉換為純文字 .txt 檔或 markdown 檔。
現時使用 Gemini 亦需摸索這些技巧,以免瞬間耗盡每 5 小時額度。用家亦應不時查看 Gemini 「用量上限」頁面以確認剩餘額度。
資料來源:Android Authority、PCWorld
