Categories: 恩想

Google Gemini 突破現時 AI 和人類間微妙平衡

2023-12-09

Published by

天恩

以往我曾撰寫過關於 ChatGPT 另一人類危機，而前天 Google 新推出的 Gemini AI 讓我們看到了技術的新突破點，這是現行 AI 技術未曾達到的進步。

首先快速解釋一下 Gemini 是甚麼。這 AI 不僅能理解文字，還能同時解析圖片和聲音的 AI ，最重要的是三種輸入是同時作比對運算，而不是獨立的 AI 迴路。例如用戶以文字輸入：“我現在公園畫畫，看看這張黃色大樹的圖畫你覺得是甚麼”，但 Gemini 接收到 Notebook web cam 影像卻是藍色天空，Mic 亦收聽到車站廣播。AI 結合這些資訊後，判斷到你在說謊。

從以上例子我們可以看出 Gemini 除了擁有“大腦”，還具備了“眼睛”和“耳朵”，而最大的變革不僅如此，通過 Google 的示範影片我們看到它已經實現了人類和機器 “無斷式” 及主動式的溝通。這正是核心技術突破 AI 和人類間平衡關鍵。雖然 Google 認了示範影片做假，但也表達這是他們短期內希望達到的目標。

以往的 AI 需要等待人類輸入指令後，才會提供範圍內的回應。就像皇帝提問，你只能按要求回答，也不能提供多餘資訊，否則就像歷史上的楊修一樣遭遇不幸。然而，在影片的 0:47 處，Gemini 打破了這種傳統互動模式，開始自發地提供關於鴨子的其他資訊。到了 0:53 即使沒有人類的提問（未發出問題），AI 仍會繼續觀察現場資料，自行提供意見，如“這不是鴨子常見的顏色”。

用人類的語言來描述，這就是“八卦”和“多口”，簡而言之，AI 不再像以往那樣受限於運算能力或機制的限制，只能遵守“一問一答，不多話不八卦”的模式。現在的 Google Gemini 於不久的將來突破能力界限後，雖然開發者對它可設其限，但實情是不為也非不能也。

這又引出了什麼問題呢？如果結合之前文章所提及的，人類偏向對 AI 答案具有無條件的信任，有心人可以利用這種能力宣傳信息。如果 AI 已學懂在最適合的時候主動提供所需的資訊，這就如同具備了一流推銷員的技巧了，能向你心裡進攻你的不足引起你的購買慾。這意味著即使你避開 AI 不讓它回答，它還是會找到合適的時機，通過不同的渠道向你提供想要傳達的資訊。