機身小巧又可以夾在衣服上的黑色盒仔,是一個專為視障人士設計的 AI 裝置「Seekr」。由一間香港初創公司所研發, Seekr 已推出了第四代,當中最主要有三個模式,分別為文字識別、深度識別及場景模式。只要連接手機 APP,再用它來拍攝一張相,AI 就可幫用家即時辦認前方事物與景物距離、數量、顏色、文字等等。
▲專為視障人士設計的 AI 裝置「Seekr」
▲當中最主要有三個模式,分別為文字識別、深度識別及場景模式
創作靈感
Seekr 創辦人及行政總裁 Turzo Bose:Seekr 是一個 AI 穿戴裝置,最初我們製作它時是為了我的祖父。在 COVID 期間,他在自己家裡識別物品時,遇到了很大的困難。大家都在實施社交隔離,所以他在家待著感到非常沮喪,總是向家人朋友求助說:「請帶我去這裡,請帶我去那裡。」他問我:「Turzo,你是工程師對吧?你能幫我做一個裝置至少可讓我在家裡找到物品嗎?」,這就是 Seekr 的起點。為什麼許多視力障礙人士,不太常到公共空間和與人交流,那些健視人士視為理所當然的互動,全因多年來空間的不便捷性,例如路邊正在施工令視障人士無法使用同一條道路,他們會因多種噪音,而感到非常害怕。健視人士可能會選擇另一條路,但對視障人士來說 情況並非如此。他們總希望可以獲取更多禎訊,這正是我們希望通過 Seekr,提供給他們的東西。
▲COVID 和 Turzo 祖父是 Seekr 誕生的起點
與其他輔助工具的分別
根據調查,香港現時視障人士大概有 20 萬,佔總人口 2.7%。當中好大部份是銀髮族因年紀漸長而出現視力問題。其實現時有不少視障人士輔助工具,例如白手杖、有聲地圖,或者一些輔助 APP 等等,以幫助視障人士生活。不過 Seekr 團隊中同為視障人士的 Kelly 就說,一般現有的輔助工具雖可保障視障人士的安全,但其實他們想要的是比,「有」和「沒有」更多的資訊。
▲香港現時視障人士大概有 20 萬,佔總人口 2.7%
項目經理 Kelly Kong:這類型工具最大不足是,它不能夠讓我知道我眼前的世界究竟有甚麼。以我的視力狀況為例,我有中間位置的視力,但中間視力其實也不是特別清楚,開始看不到顏色,亦看得比較模糊,好像攪拌機一樣,不同的東西混在一起。其實我最好奇,最想知道的亦如其他視障朋友一樣,就算不是看得很好,我不是我的人生只得到安全保障,其實我也想知道周遭發生甚麼事,有甚麼人和顏色,例如眼前的室內空間、物件有甚麼質感呢。就好像大家一樣和健視朋友一樣,我們也想知道所有環境資訊。因為很多時候,視障朋友可能會因安全考慮,習慣了特定的路線或生活方式,因為是我們最熟悉的,基本上不會出錯和有危險,但當我們知道越多資訊時,其實給了我們更多的選擇,原來我可以不用走這條路,可以走另一條路,或者可能去買東西時,除了我知道貨架本身有的東西,原來隔壁貨架也有其他東西可能是我以前較少接觸的,所以主要能加強信心和選擇。
▲項目經理Kelly Kong:當我們知道越多資訊時,其實給了我們更多的選擇
相關文章:
【教學】ChatGPT 視像隔空教你養魚 用相機攝取現場環境 實時 AI 回應用家問題 【教學】冗長文章 AI 變成有趣電台節目 Reader by ElevenLabs「聽」文章不再暈車浪 + 學習外語方便 【教學】MacWhisper 語音轉錄文字 AI 工具 本地 AI 模型處理 + 支援廣東話、多國語言 + 輸出字幕檔
Seekr 示範及試用
訪問當日看 Kelly 示範 Seekr ,不單可讓我們知道眼前物品,就連衣物顏色,前面有人做手勢,現場整體氛圍如何等也有提及,務求令用家可更好地想像整個場景。Kelly 也有提到市場上的手機輔助 APP,一來功能分得好散,二來也不太切合香港的人和事,所以他們除在設計上以視障人士角度出發外,用作訓練 AI 的素材也在香港各處收集,務求令香港用家更親切更貼地。
▲Seekr 可讓我們知道眼前物品,就連衣物顏色,前面有人做手勢,現場整體氛圍如何等也有提及
Al Lead Reshika P V:我們主要使用專門捕捉、分析圖像和影片而設計的 AI 和 Machine Learning 技術,它是基於電腦視覺深度學習技術。我們收集大量數據,包括數據標註、數據清洗,然後我們基於這些數據去訓練模型。這些數據主要來自香港,令模型非常適合香港的環境和事物,例如電車、地鐵站。其中一個難以識別的物體是玻璃門,因為它們透明,且沒有明顯的可見特徵,模型可以識別另一側的物體但無法識別玻璃本身,至於玻璃門,我們可訓練模型偵測門把以作辨認。
▲Seekr 主要使用專門捕捉、分析圖像和影片而設計的 AI 和 Machine Learning 技術
▲其中一個難以識別的物體是玻璃門,至於玻璃門,可訓練模型偵測門把以作辨認
項目經理 Kelly Kong:表現較好的場景是超級市場、一些公共交通站如地鐵站,現在辦公室場景表現非常好。我們也很集中處理室內場景,例如大家一天會去哪裡,可能是上班,在家或買東西,或坐車等等。這些場景都是跟隨使用者一天的旅程去考慮,無論去買東西,還是坐車,都是我們設計考量之一。
▲表現較好的場景是超級市場、一些公共交通站如地鐵站
Reshika 亦都提到,暫時 Seekr 支援廣東話、英文及普通話三種語言,可辨認 80 種不同事物,亦可偵測至十米左右深度。不過她也強調,其實視障人士最關心是三米內的事物,所以它們 AI 辨認時都會以三米內物件為先。而當問到他們覺得自己跟一些大 AI 公司有何不同,他們覺得其團隊經常與視障人士交流及收集意見,Seekr 比大 AI 公司會更具針對性,可更有效地滿足視障人士需要。
▲視障人士最關心是三米內的事物,所以 Seekr AI 辨認時都會以三米內物件為先
與其他大 AI 公司的分別
Seekr 創辦人及行政總裁 Turzo Bose:我必須強調 Seekr 不只關於識別物體或文本,它關乎是用戶如何利用信息,並將其融入到日常環境中。這不只是識別出椅子或桌子,而是可令用家理解到這可能有一個人坐在椅子上,這個人可能是朋友,如果 Seekr 能告訴用家這一點,那用家就可以決定如何處理這些信息,這是我們從第一天起就堅持的方針。我們是一家以用戶主導的公司,而不是以技術主導的公司,我們不想創造出一項技術,再強迫用戶使用它,跟他們說:「我有一個很厲害的技術,你們現在用吧。」然後要求他們改變日常生活方式。
▲Seekr 創辦人及行政總裁 Turzo Bose:我們是一家以用戶主導的公司,而不是以技術主導的公司
Seekr 創辦人及營運總監Lamia Sreya Rahman:加上他們也不會,因為習慣就是習慣。你看視障人士的活動度訓練時,如使用手杖和導盲犬 就是建立習慣,改變這些習慣非常困難,而為了視障人士的安全,我們也不應該去改變它們。我們所做的一切都比別家的 AI 更加詳細,例如 AI 可能會告訴你這是一個杯子,但如果這是一個透明的杯子,我們希望能夠 Seekr 預測並告訴用家,杯中是凍檸茶還是凍奶茶。這種具體對視障社群來說非常重要,因為這些信息上的差異,使他們能夠做出選擇,讓他們自行作出凍檸茶或凍奶茶等決定。有一次,一位可愛的祖母帶著她的孫女來了,我記得孫女事後來找我和 Turzo,想跟我們拍一張照片。當時我覺得很有趣,她拍了照片後說:「非常感謝,有時我的父母在工作;我上學,我們想多花點時間陪伴祖母,讓她不覺得孤單。這個裝置讓我們預視到,她會去不同的地方享受拍照過程,了解她周遭環境。」這對我們來說非常有趣,我也非常感動,這是我們第一次看到影響力,我們所相信的這個產品,以及我們在 Seeker 創造的使命和願景。
▲信息上的差異,使視障人士能夠做出選擇,讓他們自行作出凍檸茶或凍奶茶等決定
香港視障人士遇到的困難
現時香港好多公共地方,也會有加裝凹凸紋引導徑,或凸字地圖等無障礙設施,但其實使用率並不高。當中有多少是真的能幫到他們,又有多少是我地自以為幫到他們呢?
▲加裝凹凸紋引導徑,或凸字地圖等無障礙設施,但其實使用率並不高
項目經理 Kelly Kong:例如有時會迷失了方向,可能一多人或周遭環境聲音太多,本身也知道自己在哪裡,之後就會聽不清楚自己到哪裡。又例如當地鐵很多人時,大聲過廣播,就很容易飛站。道路設計也一樣,或多或少香港每個地區的地勢有些不同,甚至乎公共的設施,例如洗手間的設計有時太過多樣化,變成我們習慣了一種,嘗試去習慣一套模式的時候,誰知另一個場景用不同的設施又好像不太合適。有很多這些不斷學習,不斷挑戰自己的耐力和信心。一些可給視障人士使用的工具,譬如我自己用的 iOS 系統,它本身有放大鏡功能,有時可能想看一些東西,或者可能有個商場、餐廳,食店前有很多人,我很想看很遠的餐牌,有時候我會用放大鏡,看可不可以放近一點。可能在香港這個環境,因為真正人多車多,人口比較密集,可能有時會令旁人詫異,覺得我是不是偷拍呢?其實這是人之常情,但在我們角度,我真的想看清楚一些東西,我不是故意拍其他人的,甚至我都不知道自己在拍你,因為我的視力不是太好。所以我們團隊經常會討論,其實用電話拍照在公共地方,已經很容易有污名化情況或者會令人誤會。
▲設計有時太過多樣化,視障人士未能適應
▲項目經理 Kelly Kong:我很想看很遠的餐牌,有時候我會用放大鏡,可能有時會令旁人詫異,覺得我是不是偷拍呢
Seekr 創辦人及營運總監 Lamia Sreya Rahman:在社會福利署,有關經濟援助的方案,它會為任何視障人士或有殘疾的人發放 40,000 港元津貼,用作購買輔助技術,幫助他們重新融入社會,但說實話,現有的技術、工具價格非常昂貴,可能會耗盡整個資金,僅僅能購買一個輔助裝置。你看看香港的博物館,香港實際上擁有非常美麗的博物館,無論是藝術、科學還是文化方面,我知道有時候每六個月,它們就會更換展覽,嘗試引入新的展品,我總是想,這些展覽都非常視覺化,例如藝術、顏色、那些花卉或雕像,都很視覺化,那麼對視障人士來說怎麼辦呢?我們能如何讓他們也能享受這種體驗呢?如果我們能有裝置可以描述藝術作品,讓他們能夠想像出來,並參與博物館,那又會怎麼樣呢。
▲Seekr 創辦人及營運總監 Lamia Sreya Rahman:40,000 港元津貼可能僅僅能購買一個輔助裝置
項目經理 Kelly Kong:我們視障朋友這個圈子,其實也想如所有人一樣,用自己的方法生活,然後不要因有身體的障礙或者有特別的需要,就看低了我們的能力。我們一直有討論社會文化共融多元,其實是真的很重要。
相關文章:
【教學】ChatGPT 視像隔空教你養魚 用相機攝取現場環境 實時 AI 回應用家問題 【教學】冗長文章 AI 變成有趣電台節目 Reader by ElevenLabs「聽」文章不再暈車浪 + 學習外語方便 【教學】MacWhisper 語音轉錄文字 AI 工具 本地 AI 模型處理 + 支援廣東話、多國語言 + 輸出字幕檔