有不少人誤以為 Live Transcribe 是個類似語音輸入法的東西,不過它的用途其實是協助聽障人士參與日常對話,破除溝通障礙,是個實時將語音變成文字的免費手機APP。透過應用 Google AI語音辦識技術,它不只可以即時將對話變成字幕,還能辨認逾 40種環境聲(包括狗叫、拍手,風聲及汽車響號聲等),將聲音變成看得見的東西。娜姐接下來就分享實試結果,看看Live Transcribe有多實用!
Live Transcribe的誕生原來多得爺爺嫲嫲!
今次娜姐獲邀到東京Google總部出席「Solve with AI」的活動,有幸可以見到Google AI產品的高級經理 Sagar Savla,聽他講講為甚能要研發這個手機APP。他引述自己和年邁的爺爺嫲嫲平日對話的經歷,指出他們因聽力開始衰退,經常聽不清楚孫子及家人說甚麼,但又不想煩人的一再要求重覆,結果由從前「開籠雀」般說話,變得被動寡言。於是Google AI隊團就運用AI自動語音識別多年的技術積累,研發這個APP。又再一次證明很多發明的動機,其實是源於日常生活Pain Point。
▲Sagar解釋隊團首先要建立好聲學模型,令APP單從聲音判斷音素(phoneme)。然後就是發音模型,根據音節再組合成單詞,辨出到底該人是在說「Your」還是「You’re」。最後就是語言模型,根據單詞自行依人類語言使用習慣去添加標點及停頓。
▲其實這個聽得懂 70種語言的 Live Transcribe APP(又名為「即時轉錄」)在 2019年 2月時已經推出,但現在更新後,它能分辨出超過 40種的環聲,將更多聲音變成文字,協助聽障人士參與對話,打破隔閡。連周遭的環鏡聲都能判斷到,相當厲害!
▲當日有來自印度的講者,Live Transcribe將演說內容變成即時字幕,協助理解,效果很不錯。
一開即錄 對話及環境聲即變字幕
Live Transcribe的操作非常簡單,一打開APP,手機咪就馬上將對話內容轉為看得見的文字。娜姐在坐在演講聽時開着這個APP,它就自動將講者所講的內容打出來,速度尚自即時,而且有時它還會自行按前文後理作出字幕的修正。當然現階段未能做到 100% 準確,但其實有這個APP的幫忙,已經可以大大改善聽障人士的生活了。
▲打開Live Transcribe APP,娜姐第一時間就去設定語言選項,發現不再只寫着「中文(繁體)」,而是分得更細的列明為「廣東話(香港)」,立即覺得很有親切感。
▲娜姐覺得英文比廣東話更為準確,不過明白廣東話被認為其中一個最難學習的方言,Live Transcribe有如此的嘗試已經令人覺得興奮!希望之後隨時間及用家數量增加,AI能學會為廣東話對話加入停頓及標點啦~
▲可以調校字體大小,老花的人無眼鏡在身邊都無問題。而是次的更新,還可以將字幕儲存最多 3日,同時亦設有複製和貼上的功能,方便需要文字引述的用家。
▲如果聽不懂內容,可以長按直至出現翻譯選項,便能用Google Translate協助理解,非常方便。
不過記得!所有設定都要在開始轉錄對話前做好,若中途離開,APP便會錯過對話。而暫時亦只有Android 手機適用,iOS的手機用家要耐心等等了。