香港科技大學教授張軍及孟子立團隊近日主導實驗,安排學生佩戴若琪 Glasses 智能眼鏡並搭配 GPT-5.2 大模型,參加大三專業課《計算機網絡原理》本科期末考試。實驗期望測試 AI 於標準化考試表現水平,亦引致教育界討論傳統評估體系。

AI 眼鏡 30 分鐘完成考試
考生答題時只需低頭注視試卷,若琪 Glasses 攝影機即可快速拍攝題目,試卷相片經「眼鏡-手機-雲端」路徑傳輸至遠端大模型分析推理。系統生成答案後沿相同路徑返回,並於 AI 眼鏡螢幕清晰顯示。整個推理過程僅需 0.8 秒完成,方便學生抄錄答案。
測試者最終僅耗時 30 分鐘即獲得 92.5 分成績,於 100 多人班級名列前 5 名,遠超學生平均分 72 分。雖然班上最優秀考生獲 97.5 分高分,但耗時 3 小時,遠遜 AI 答題速度。

硬件篩選與技術表現
研究團隊於實驗前評估市面 12 款主流商業智能眼鏡,包括 Meta、小米及若琪等產品,最終選用開發自由度較高若琪 Glasses。這款眼鏡採用 Snapdragon AR1 Gen 1 晶片,重量僅 49 克,配備 12MP Sony IMX681 攝影機及雙 Micro-LED 波導顯示器。
軟件方面,團隊選用反應速度與知識儲備俱佳 ChatGPT-5.2 模型。GPT-5.2 於 GPQA Diamond 博士級科學推理測試取得 92.4% 準確率,展示強大科學分析能力。該模型於 AIME 2025 數學競賽基準測試更取得 100% 滿分。

答題表現與失分原因
觀察具體答題結果,若琪於選擇題及單頁解答題均獲滿分,跨頁解答題亦取得大部分分數。失分主因在於部分跨頁大題子問題分布不同頁面,令 AI 眼鏡無法一次看清所有資料。
測試團隊總結指出,若琪答錯題目均屬難度較高、需推理計算的小題,對大模型分析推理能力要求極高。從作答情況可見,雖然最終答案錯誤,但大模型仍能提供相當一部分推理過程。

功耗與教育評估挑戰
若琪智能眼鏡於測試期間開啟 Wi-Fi 傳輸高解像度相片,耗電量顯著增加,答題 30 分鐘後電量由 100% 跌至 58%,反映智能終端裝置功耗與連線穩定性仍面臨考驗。
實驗亦令教育界探討傳統評估體系。當 AI 能穩定於標準化考試奪取高分,以往閉卷筆試為主的評估方式或需重新思考。教育機構現已開始採用 AI 監考工具檢測作弊行為,包括眼球追蹤、背景噪音監測及寫作風格分析等技術。
資料來源:新浪科技
分享到 :
最新影片
