iPhone4S 其中一個賣點便是名為 Siri 的聲音辨識功能,從此手機便擁有理解語言並作出反應的能力。Siri 是 2010 年 Apple 收購回來的公司所研究的同名技術,最早源自由美國國防部高等研究計畫局(DARPA)出資、SRI International 執行的研究計畫 CALO(Cognitive Assistant that Learns and Organizes)。計畫動員了從美國一流大學和研究機構挑選出來的 300 名專家,數年後由 CALO 分拆出來的便是 Siri。
聲音辨識技術歷史悠久,Apple 亦曾經幾度希望將它實用化,早在 1990 年代 Macintosh 胎死腹中的作業系統 Copland 中,就曾經嘗試引入名為 Active Interface 的用戶界面,目標是製作一台可以聽得懂口述命令並執行的電腦,但最後卻未能成功,原因是當時聲音辨識的準確性太低。聲音辨識功能是介乎人和機器的用戶界面的一種,早在上世紀 60 年代已經有人研究,而且同樣是由 DARPA 資助的計畫。
當時用戶界面的研究分為人工智能(Artificial Intelligence, AI)和智能增強(Intelligence Amplification, IA)兩派,AI 派認為人類下只要下命令就可以,如何完成應由電腦自己去想辦法。IA 派則認為人類應該主導思考,電腦只是負責協助完成任務的工具,日後的滑鼠和圖像界面(GUI)便是根據 IA 的理念而發明的,首個整合了滑鼠和 GUI 的便是 Macintosh。
IA 的成功令 AI 被打入冷宮,但 Internet 的出現卻令 AI 的研究再現生機。研究自然語言處理的學者,將在網路上的大量文字資料載入電腦,令稱為 Parser 的語言解析技術得到飛躍的進步,加上在手機上沿用滑鼠和鍵盤根本不切實際,最後促使了 Siri 的出現。AI 在開源世界同樣活躍,其中一個開源 AI 計畫 OpenCog 最近就得到香港政府和美國廠商 Novamente LLC 的投資,將聘請專材在香港理工大學展開有關研究,有志研究 AI 的朋友,是一展身手的時候了。
《此文全屬個人評論不代表本站立場,歡迎讀者投稿對 IT 事作評論》
作者資料 :
Kenneth Mak – Linuxpilot.com 主筆,香港樹仁大學工商管理系畢業,樸次茅斯大學資訊科技商業策略碩士。曾留學日本,1997 年獲日本文部省授與文化教養專門士稱號。曾任「多媒體雜志」編輯,及「星島電腦廣場」、「經濟一周」專欄作家,撰寫 IT 應用文章,并有超過十年 Linux 操作經驗,曾編寫「中文 Linux 入門」、「中文 Linux 攻略本」等 Linux 入門指南,有能力駕馭高深的 UNIX/Linux 技術,以及有良好的資訊科技知識表達能力。