人工智能

【專訪】褔山雅治《Last Man》 AI 眼睛製作團隊香港初創公司解說實現歷程、親身示範

作者

Pickle Rick
發佈日期

2024-09-30
閱讀時間

16分鐘
字體大小

機身小巧又可以夾在衣服上的黑色盒仔，是一個專為視障人士設計的 AI 裝置「Seekr」。由一間香港初創公司所研發， Seekr 已推出了第四代，當中最主要有三個模式，分別為文字識別、深度識別及場景模式。只要連接手機 APP，再用它來拍攝一張相，AI 就可幫用家即時辦認前方事物與景物距離、數量、顏色、文字等等。

▲專為視障人士設計的 AI 裝置「Seekr」

▲當中最主要有三個模式，分別為文字識別、深度識別及場景模式

創作靈感

Seekr 創辦人及行政總裁 Turzo Bose：Seekr 是一個 AI 穿戴裝置，最初我們製作它時是為了我的祖父。在 COVID 期間，他在自己家裡識別物品時，遇到了很大的困難。大家都在實施社交隔離，所以他在家待著感到非常沮喪，總是向家人朋友求助說：「請帶我去這裡，請帶我去那裡。」他問我：「Turzo，你是工程師對吧？你能幫我做一個裝置至少可讓我在家裡找到物品嗎？」，這就是 Seekr 的起點。為什麼許多視力障礙人士，不太常到公共空間和與人交流，那些健視人士視為理所當然的互動，全因多年來空間的不便捷性，例如路邊正在施工令視障人士無法使用同一條道路，他們會因多種噪音，而感到非常害怕。健視人士可能會選擇另一條路，但對視障人士來說情況並非如此。他們總希望可以獲取更多禎訊，這正是我們希望通過 Seekr，提供給他們的東西。

▲COVID 和 Turzo 祖父是 Seekr 誕生的起點

與其他輔助工具的分別

根據調查，香港現時視障人士大概有 20 萬，佔總人口 2.7%。當中好大部份是銀髮族因年紀漸長而出現視力問題。其實現時有不少視障人士輔助工具，例如白手杖、有聲地圖，或者一些輔助 APP 等等，以幫助視障人士生活。不過 Seekr 團隊中同為視障人士的 Kelly 就說，一般現有的輔助工具雖可保障視障人士的安全，但其實他們想要的是比，「有」和「沒有」更多的資訊。

▲香港現時視障人士大概有 20 萬，佔總人口 2.7%

項目經理 Kelly Kong：這類型工具最大不足是，它不能夠讓我知道我眼前的世界究竟有甚麼。以我的視力狀況為例，我有中間位置的視力，但中間視力其實也不是特別清楚，開始看不到顏色，亦看得比較模糊，好像攪拌機一樣，不同的東西混在一起。其實我最好奇，最想知道的亦如其他視障朋友一樣，就算不是看得很好，我不是我的人生只得到安全保障，其實我也想知道周遭發生甚麼事，有甚麼人和顏色，例如眼前的室內空間、物件有甚麼質感呢。就好像大家一樣和健視朋友一樣，我們也想知道所有環境資訊。因為很多時候，視障朋友可能會因安全考慮，習慣了特定的路線或生活方式，因為是我們最熟悉的，基本上不會出錯和有危險，但當我們知道越多資訊時，其實給了我們更多的選擇，原來我可以不用走這條路，可以走另一條路，或者可能去買東西時，除了我知道貨架本身有的東西，原來隔壁貨架也有其他東西可能是我以前較少接觸的，所以主要能加強信心和選擇。

▲項目經理Kelly Kong：當我們知道越多資訊時，其實給了我們更多的選擇

Seekr 示範及試用

訪問當日看 Kelly 示範 Seekr ，不單可讓我們知道眼前物品，就連衣物顏色，前面有人做手勢，現場整體氛圍如何等也有提及，務求令用家可更好地想像整個場景。Kelly 也有提到市場上的手機輔助 APP，一來功能分得好散，二來也不太切合香港的人和事，所以他們除在設計上以視障人士角度出發外，用作訓練 AI 的素材也在香港各處收集，務求令香港用家更親切更貼地。

▲Seekr 可讓我們知道眼前物品，就連衣物顏色，前面有人做手勢，現場整體氛圍如何等也有提及

Al Lead Reshika P V：我們主要使用專門捕捉、分析圖像和影片而設計的 AI 和 Machine Learning 技術，它是基於電腦視覺深度學習技術。我們收集大量數據，包括數據標註、數據清洗，然後我們基於這些數據去訓練模型。這些數據主要來自香港，令模型非常適合香港的環境和事物，例如電車、地鐵站。其中一個難以識別的物體是玻璃門，因為它們透明，且沒有明顯的可見特徵，模型可以識別另一側的物體但無法識別玻璃本身，至於玻璃門，我們可訓練模型偵測門把以作辨認。

▲Seekr 主要使用專門捕捉、分析圖像和影片而設計的 AI 和 Machine Learning 技術

▲其中一個難以識別的物體是玻璃門，至於玻璃門，可訓練模型偵測門把以作辨認

項目經理 Kelly Kong：表現較好的場景是超級市場、一些公共交通站如地鐵站，現在辦公室場景表現非常好。我們也很集中處理室內場景，例如大家一天會去哪裡，可能是上班，在家或買東西，或坐車等等。這些場景都是跟隨使用者一天的旅程去考慮，無論去買東西，還是坐車，都是我們設計考量之一。

▲表現較好的場景是超級市場、一些公共交通站如地鐵站

Reshika 亦都提到，暫時 Seekr 支援廣東話、英文及普通話三種語言，可辨認 80 種不同事物，亦可偵測至十米左右深度。不過她也強調，其實視障人士最關心是三米內的事物，所以它們 AI 辨認時都會以三米內物件為先。而當問到他們覺得自己跟一些大 AI 公司有何不同，他們覺得其團隊經常與視障人士交流及收集意見，Seekr 比大 AI 公司會更具針對性，可更有效地滿足視障人士需要。

▲視障人士最關心是三米內的事物，所以 Seekr AI 辨認時都會以三米內物件為先

與其他大 AI 公司的分別

Seekr 創辦人及行政總裁 Turzo Bose：我必須強調 Seekr 不只關於識別物體或文本，它關乎是用戶如何利用信息，並將其融入到日常環境中。這不只是識別出椅子或桌子，而是可令用家理解到這可能有一個人坐在椅子上，這個人可能是朋友，如果 Seekr 能告訴用家這一點，那用家就可以決定如何處理這些信息，這是我們從第一天起就堅持的方針。我們是一家以用戶主導的公司，而不是以技術主導的公司，我們不想創造出一項技術，再強迫用戶使用它，跟他們說：「我有一個很厲害的技術，你們現在用吧。」然後要求他們改變日常生活方式。

▲Seekr 創辦人及行政總裁 Turzo Bose：我們是一家以用戶主導的公司，而不是以技術主導的公司

Seekr 創辦人及營運總監Lamia Sreya Rahman：加上他們也不會，因為習慣就是習慣。你看視障人士的活動度訓練時，如使用手杖和導盲犬就是建立習慣，改變這些習慣非常困難，而為了視障人士的安全，我們也不應該去改變它們。我們所做的一切都比別家的 AI 更加詳細，例如 AI 可能會告訴你這是一個杯子，但如果這是一個透明的杯子，我們希望能夠 Seekr 預測並告訴用家，杯中是凍檸茶還是凍奶茶。這種具體對視障社群來說非常重要，因為這些信息上的差異，使他們能夠做出選擇，讓他們自行作出凍檸茶或凍奶茶等決定。有一次，一位可愛的祖母帶著她的孫女來了，我記得孫女事後來找我和 Turzo，想跟我們拍一張照片。當時我覺得很有趣，她拍了照片後說：「非常感謝，有時我的父母在工作；我上學，我們想多花點時間陪伴祖母，讓她不覺得孤單。這個裝置讓我們預視到，她會去不同的地方享受拍照過程，了解她周遭環境。」這對我們來說非常有趣，我也非常感動，這是我們第一次看到影響力，我們所相信的這個產品，以及我們在 Seeker 創造的使命和願景。

▲信息上的差異，使視障人士能夠做出選擇，讓他們自行作出凍檸茶或凍奶茶等決定

香港視障人士遇到的困難

現時香港好多公共地方，也會有加裝凹凸紋引導徑，或凸字地圖等無障礙設施，但其實使用率並不高。當中有多少是真的能幫到他們，又有多少是我地自以為幫到他們呢？

▲加裝凹凸紋引導徑，或凸字地圖等無障礙設施，但其實使用率並不高

項目經理 Kelly Kong：例如有時會迷失了方向，可能一多人或周遭環境聲音太多，本身也知道自己在哪裡，之後就會聽不清楚自己到哪裡。又例如當地鐵很多人時，大聲過廣播，就很容易飛站。道路設計也一樣，或多或少香港每個地區的地勢有些不同，甚至乎公共的設施，例如洗手間的設計有時太過多樣化，變成我們習慣了一種，嘗試去習慣一套模式的時候，誰知另一個場景用不同的設施又好像不太合適。有很多這些不斷學習，不斷挑戰自己的耐力和信心。一些可給視障人士使用的工具，譬如我自己用的 iOS 系統，它本身有放大鏡功能，有時可能想看一些東西，或者可能有個商場、餐廳，食店前有很多人，我很想看很遠的餐牌，有時候我會用放大鏡，看可不可以放近一點。可能在香港這個環境，因為真正人多車多，人口比較密集，可能有時會令旁人詫異，覺得我是不是偷拍呢？其實這是人之常情，但在我們角度，我真的想看清楚一些東西，我不是故意拍其他人的，甚至我都不知道自己在拍你，因為我的視力不是太好。所以我們團隊經常會討論，其實用電話拍照在公共地方，已經很容易有污名化情況或者會令人誤會。

▲設計有時太過多樣化，視障人士未能適應

▲項目經理 Kelly Kong：我很想看很遠的餐牌，有時候我會用放大鏡，可能有時會令旁人詫異，覺得我是不是偷拍呢

Seekr 創辦人及營運總監 Lamia Sreya Rahman：在社會福利署，有關經濟援助的方案，它會為任何視障人士或有殘疾的人發放 40,000 港元津貼，用作購買輔助技術，幫助他們重新融入社會，但說實話，現有的技術、工具價格非常昂貴，可能會耗盡整個資金，僅僅能購買一個輔助裝置。你看看香港的博物館，香港實際上擁有非常美麗的博物館，無論是藝術、科學還是文化方面，我知道有時候每六個月，它們就會更換展覽，嘗試引入新的展品，我總是想，這些展覽都非常視覺化，例如藝術、顏色、那些花卉或雕像，都很視覺化，那麼對視障人士來說怎麼辦呢？我們能如何讓他們也能享受這種體驗呢？如果我們能有裝置可以描述藝術作品，讓他們能夠想像出來，並參與博物館，那又會怎麼樣呢。

▲Seekr 創辦人及營運總監 Lamia Sreya Rahman：40,000 港元津貼可能僅僅能購買一個輔助裝置

項目經理 Kelly Kong：我們視障朋友這個圈子，其實也想如所有人一樣，用自己的方法生活，然後不要因有身體的障礙或者有特別的需要，就看低了我們的能力。我們一直有討論社會文化共融多元，其實是真的很重要。

【專訪】褔山雅治《Last Man》 AI 眼睛製作團隊香港初創公司解說實現歷程、親身示範

創作靈感

與其他輔助工具的分別

Seekr 示範及試用

與其他大 AI 公司的分別

香港視障人士遇到的困難

分享到 :

最新影片

Follow 我們 :