Claude 3 Opus 學術測試成績優秀　有望成為大學生最佳學習伙伴

作者

藍骨
發佈日期

2024-04-30
閱讀時間

5分鐘
字體大小

生成式 AI 正處於急速進化的階段。AI 公司 Anthropic 最新推出的大型語言模型 Claude 3，其三個版本中號稱最強的 Opus，更預期會為各行各業，尤其有著內容創作及文本分析需要的範疇帶來突破性的 AI 應用。

根據 Anthropic，Opus 在進行學士級專業知識（MMLU）、碩士級邏輯推理（GPQA）、基礎數學（GSM8K）、編程（Code）等多項有關大型語言模型的測試中，都取得比 Claude3 的其他版本，以至 GPT 4 及 Gemini Ultra 等同類模型更出色的表現。那麼，對於需要面對大量資料搜集、寫作、閱讀理解、解難等學習過程的大學生而言，Opus 又能為他們帶來甚麼幫助？

應答流暢有助協助資料搜集和整理

有專門研究 AI 學術應用的學者，就透過一連串與學習相關的測試，發現 Opus 不但能夠在開放式指令中以驚人的流暢性完成應答，更具備人性化的理解和辨識複雜情景的能力。在一項測試中，學者在未有詳細解釋下，要求 Opus 協助撰寫一項有關「OPV」的文獻探究（Literature Review）寫作大綱，結果 Opus 不但正確理解「OPV」，更在極短時間內生成既詳盡又深入，而且準確涵蓋相關討論範疇的大綱，大大提升撰寫文章的效率。

此外，Opus 在另一項有關資料搜集的測試中同樣表現不俗。學者以撰寫博士論文為切入點，要求 Opus 提供三份文獻作為參考，結果 Opus 成功提出三份真實而且相關的文獻，但受限於其資料庫的更新時間，Opus 所找到的文獻有機會較為過時，但仍能在一定程度上節省學生在茫茫資料庫中找尋相關資訊的時間。

另一方面，以理解影像著稱的 Opus，在閱讀相片、圖表、函數圖及工程圖表等在研究作業常見的視覺資訊上的測試同樣令人印象深刻，在一項測試中更能在分析電路原理圖時，準確辨認出各項組件，並能提供清晰易明的解釋，有助學生理解不同的複雜概念。

分析資料及調查數據能力優秀

分析資料及調查數據亦是 Opus 令人眼前一亮的範疇。學者透過提供一份有關博士學習體驗調查的原始數據檔案，以測試 Opus 的分析能力，結果 Opus 成功消化檔案中的複雜數據，並能夠精準總結出各種發現，包括受訪者在學習過程中所遇到的正面評價及挑戰，以至日常校園生活及應用 AI 工具的經驗，顯示 Opus 有能力簡化及以文字總結以數據為主的研究，大大節省以人手閱覽數據的時間。

對於大學生而言，寫作相信是他們日常面對的一大難題。事實上，Opus 的上下文視窗及對多語言文字的掌控能力相當強大，在一項測試中，Opus 成功透過簡單指令生成出 20 個有趣、簡結但引人入勝的社交媒體及文本標題。在另一項有關延續故事的測試中，Opus 透過測試者提供的部分情節及角色，就能創作出結構完整、情理兼備兼引人入勝的故事，並能夠維持遣詞用字的一致性。學生將能透過 Opus 提升文學修為，甚至發展更豐富的創意。

透過這些第三方測試結果，我們可以了解到 Opus 作為一項 AI 助理，能夠以高品質的效能及表現，為大學水平的學習及研究提供重要協助。隨著生成式 AI 的不斷改良，大學生在進行學術研究及提升學習效率上將獲得最大助力，而 Opus 在現階段作為最強大的大型語言模型，勢將成為學生及研究生的最佳學習伙伴。

Claude 3 現時已在 AWS 旗下的 Amazon Bedrock 上推出，有興趣的企業可在平台上透過包括 Opus、Sonnet、Haiku 在內三個版本，應用於不同場景。