科大教授實測 AI 眼鏡考試 30 分鐘獲 92.5 分超越 95% 學生

香港科技大學教授張軍及孟子立團隊近日主導實驗，安排學生佩戴若琪 Glasses 智能眼鏡並搭配 GPT-5.2 大模型，參加大三專業課《計算機網絡原理》本科期末考試。實驗期望測試 AI 於標準化考試表現水平，亦引致教育界討論傳統評估體系。

AI 眼鏡 30 分鐘完成考試

考生答題時只需低頭注視試卷，若琪 Glasses 攝影機即可快速拍攝題目，試卷相片經「眼鏡-手機-雲端」路徑傳輸至遠端大模型分析推理。系統生成答案後沿相同路徑返回，並於 AI 眼鏡螢幕清晰顯示。整個推理過程僅需 0.8 秒完成，方便學生抄錄答案。

測試者最終僅耗時 30 分鐘即獲得 92.5 分成績，於 100 多人班級名列前 5 名，遠超學生平均分 72 分。雖然班上最優秀考生獲 97.5 分高分，但耗時 3 小時，遠遜 AI 答題速度。

研究團隊於實驗前評估市面 12 款主流商業智能眼鏡，包括 Meta、小米及若琪等產品，最終選用開發自由度較高若琪 Glasses。這款眼鏡採用 Snapdragon AR1 Gen 1 晶片，重量僅 49 克，配備 12MP Sony IMX681 攝影機及雙 Micro-LED 波導顯示器。

軟件方面，團隊選用反應速度與知識儲備俱佳 ChatGPT-5.2 模型。GPT-5.2 於 GPQA Diamond 博士級科學推理測試取得 92.4% 準確率，展示強大科學分析能力。該模型於 AIME 2025 數學競賽基準測試更取得 100% 滿分。

觀察具體答題結果，若琪於選擇題及單頁解答題均獲滿分，跨頁解答題亦取得大部分分數。失分主因在於部分跨頁大題子問題分布不同頁面，令 AI 眼鏡無法一次看清所有資料。

測試團隊總結指出，若琪答錯題目均屬難度較高、需推理計算的小題，對大模型分析推理能力要求極高。從作答情況可見，雖然最終答案錯誤，但大模型仍能提供相當一部分推理過程。

若琪智能眼鏡於測試期間開啟 Wi-Fi 傳輸高解像度相片，耗電量顯著增加，答題 30 分鐘後電量由 100% 跌至 58%，反映智能終端裝置功耗與連線穩定性仍面臨考驗。

實驗亦令教育界探討傳統評估體系。當 AI 能穩定於標準化考試奪取高分，以往閉卷筆試為主的評估方式或需重新思考。教育機構現已開始採用 AI 監考工具檢測作弊行為，包括眼球追蹤、背景噪音監測及寫作風格分析等技術。

資料來源：新浪科技

此文於 FB 熱討中 💬