
在這個人人上網的年代,視障人士卻往往被困在看不見的數碼迷宮。來自VTC香港資訊科技學院的學生團隊研發出「A-Eye」AI語音上網助理,將圖片與網頁轉化成聲音,讓視障人士可以用「聽」來探索世界,重新掌握上網的主導權。
以前好似你畀咗一張地圖人,但佢睇唔到,要自己慢慢摸。 —A-Eye團隊
//當時我就諗,如果似同人講嘢咁上網,會唔會簡單好多?—Vincent//
「我第一次見視障朋友上網嗰一刻,真係好震撼。」研發團隊核心成員尹文敬(Vincent)仍記得那次經歷。當時他參與另一個無障礙項目,看着一位視障人士用一連串鍵盤指令,慢慢「讀」完整個網頁。
「原來我哋覺得好簡單嘅動作,對佢哋嚟講可以咁困難。」他說。要聽完整頁內容,找一個按鈕,甚至只是跳去下一段,都需要記住大量快捷鍵,稍一出錯就要重來。「嗰一刻我就諗,如果可以好似同人講嘢咁上網,會唔會簡單好多?」這個想法,成為A-Eye的起點。
A-Eye的設計理念很直接:用自然語音,取代複雜指令。使用者只要開啟瀏覽器,啟動A-Eye,就可以直接說:「總結呢一頁」、「描述呢張圖」、「我想買呢件衫」、「幫我睇吓呢個表格寫咩。」
系統會即時用AI分析網頁內容,包括圖片、圖表與排版,再轉化成語音回饋。以往屏幕閱讀器讀不到的圖片,例如一件衣服、一張產品圖、一幅流程圖,A-Eye都可以「睇」到,再用說話講給用戶聽。
Vincent說:「以前好似你畀咗一張地圖人,但佢睇唔到,要自己慢慢摸。」在實際應用中,團隊發現一個很重要的問題:不少視障人士都擔心私隱。上網買嘢、填表、登入銀行,如果全部資料都要傳上雲端處理,會否不安全?
團隊研發AI語音上網助理,獲得「2025香港資訊及通訊科技獎」組別獎項銀獎。
//你可以自己揀,想要私隱多啲,定想要分析快啲。—Alex//
團隊成員張育瀚(Alex)於是設計了一個「雙模式」系統——用戶可以選擇用「本地AI」處理,或使用「雲端AI」獲得更高效能。「你可以自己揀,想要私隱多啲,定想要分析快啲。」Alex說。
真正令團隊最感動的,不是獎項,而是用家的反應。一次到社福機構試用時,有視障人士向他們分享:「我最怕網購,因為全部都係圖片,我根本唔知自己買緊乜。」當A-Eye將產品圖片逐一描述,他第一次可以「聽到」商品的樣子。
另一位有IT背景的視障測試員更指出:「對我嚟講,聲音就係我嘅眼睛。」他形容,用A-Eye上網,不再只是被動地去聽,而是可以主動探索,「好似重新攞返主導權。」這句話,成為整個團隊最珍貴的肯定。
聚焦研發,並不斷根據用戶意見而更新。
【盼助建「真.數碼共融」社會】
現時A-Eye已在Chrome網上應用商店免費下載,團隊正不斷根據用戶意見更新,例如加入多語言、優化聲音描述、改善操作流暢度。
在技術層面上力臻完善,誠然,他們的目標,不只是一個軟件。「我哋想建立一個真正數碼共融嘅環境。」Alex說。未來,A-Eye希望能協助填寫表格、處理銀行服務、應付更複雜的網頁操作,讓視障人士在學習、工作、生活中,真正不再被科技隔開。
西貢
專訪
生活
學習
科技
社區人家