日本最新研究顯示,AI 分析 11 歲兒童撰寫的短篇作文,能夠高精度預測其 22 年後的最終學歷及認知能力。研究團隊利用 1958 年出生的英國兒童約 1 萬人在 11 歲時撰寫的「想像 25 歲的自己」主題作文進行分析,發現 AI 預測準確度與教師評估相當,並明顯優於基因數據預測。
研究分析平均約 250 字的短篇作文,運用 OpenAI GPT 模型等大型語言模型提取 1536 維特徵量,並測量 534 項語言指標、可讀性及文法拼字錯誤等。結果顯示,AI 從作文內容預測 11 歲時讀解力的準確度達 59%,教師評估為 57%,而基因數據預測僅為 14%。
研究同時發現,作文分析能預測語言能力、數學能力等認知技能,準確度均達 55% 以上。對於非認知特質如職業抱負、學習動機等預測精度較低,但仍優於基因預測。研究人員指出,結合作文、教師評估及基因數據三種方法,預測精度可提升至接近標準智力測驗的重測信度水平。

更令人驚訝的是,11 歲時的作文內容能夠高精度預測 33 歲時的最終學歷等教育成就。研究顯示,純粹基於作文的預測準確度達 26%,教師評估為 29%,基因數據為 19%。當三種方法結合使用時,教育成就預測準確度可達 38%。
相比之下,傳統社會學預測因子如父母教育程度僅能達到 12% 的準確度,出生體重及身高等生物學指標預測準確度更只有 1% 至 3%。研究團隊重建了類似「脆弱家庭挑戰」研究的社會學模型,包含性別、父母教育水平、社會階層等變數,預測準確度為 18%,仍遠低於 AI 文本分析結果。
研究進一步分解不同文本分析技術的貢獻,發現深度學習嵌入技術發揮關鍵作用。傳統可讀性指標、拼字文法錯誤比率、計算語言學測量等方法雖有一定效果,但深度學習嵌入技術幾乎包含了所有重要資訊,成為預測準確度的主要驅動因素。
研究採用 SuperLearner 框架,結合極端梯度提升、隨機森林、支援向量機等多種機器學習演算法,透過交叉驗證避免過度擬合。結果顯示線性模型及隨機森林在大部分預測中獲得最高權重。
這項研究挑戰了過往「人生本質上不可預測」的觀點。相較於先前研究使用標準社會調查數據僅能解釋約 20% 的個體差異,本研究透過非標準數據源大幅提升預測精度。研究指出,近年自然語言處理技術的革命性發展,為行為科學家提供了預測心理社會特徵的強大工具。
國際大學校長橘川武郎等專家認為,雖然研究展示了文本預測的潛力,但仍需考慮倫理問題。隨著預測準確度持續提升並整合至社會各層面,如何適當規範這些應用系統將成為重要課題。研究亦強調需要更多結合不同類型非標準數據的縱向數據集,以驗證結果的普遍性。
不過研究承認存在限制,包括樣本僅限於 1958 年出生的英國兒童,結果是否適用於當代學生仍待驗證。此外,研究未能充分探索三種資訊來源,未來可透過更先進的 GPT 模型及貝氏方法進一步提升預測準確度。
來源:Nature
分享到 :
最新影片