以往我曾撰寫過關於 ChatGPT 另一人類危機 ,而前天 Google 新推出的 Gemini AI 讓我們看到了技術的新突破點,這是現行 AI 技術未曾達到的進步。
首先快速解釋一下 Gemini 是甚麼。這 AI 不僅能理解文字,還能同時解析圖片和聲音的 AI ,最重要的是三種輸入是同時作比對運算,而不是獨立的 AI 迴路。例如用戶以文字輸入:“我現在公園畫畫,看看這張黃色大樹的圖畫你覺得是甚麼”,但 Gemini 接收到 Notebook web cam 影像卻是藍色天空,Mic 亦收聽到車站廣播。AI 結合這些資訊後,判斷到你在說謊。
從以上例子我們可以看出 Gemini 除了擁有“大腦”,還具備了“眼睛”和“耳朵”,而最大的變革不僅如此,通過 Google 的示範影片
我們看到它已經實現了人類和機器 “無斷式” 及主動式的溝通。這正是核心技術突破 AI 和人類間平衡關鍵。雖然 Google 認了示範影片做假,但也表達這是他們短期內希望達到的目標。
以往的 AI 需要等待人類輸入指令後,才會提供範圍內的回應。就像皇帝提問,你只能按要求回答,也不能提供多餘資訊,否則就像歷史上的楊修一樣遭遇不幸。然而,在影片的 0:47 處,Gemini 打破了這種傳統互動模式,開始自發地提供關於鴨子的其他資訊。到了 0:53 即使沒有人類的提問(未發出問題),AI 仍會繼續觀察現場資料,自行提供意見,如“這不是鴨子常見的顏色”。
用人類的語言來描述,這就是“八卦”和“多口”,簡而言之,AI 不再像以往那樣受限於運算能力或機制的限制,只能遵守“一問一答,不多話不八卦”的模式。現在的 Google Gemini 於不久的將來突破能力界限後,雖然開發者對它可設其限,但實情是不為也非不能也。
這又引出了什麼問題呢?如果結合之前文章所提及的,人類偏向對 AI 答案具有無條件的信任,有心人可以利用這種能力宣傳信息。如果 AI 已學懂在最適合的時候主動提供所需的資訊,這就如同具備了一流推銷員的技巧了,能向你心裡進攻你的不足引起你的購買慾。這意味著即使你避開 AI 不讓它回答,它還是會找到合適的時機,通過不同的渠道向你提供想要傳達的資訊。