義工 Sergio 挺身接手承傳 David Webb 數據庫 協助公眾監察市場運作

Published by
Lawton

獨立股評人 David Webb 於 1 月 13 日病逝,享年 60 歲 。他創辦的財經資料庫 Webb-site 在去年 10 月停運後 ,數據科學愛好者 Sergio 決定接手項目,將平台易名為 webb-database.com 繼續營運 ,延續這個被視為香港上市公司「照妖鏡」的監察工作 。

單靠義工難以維持專業資料庫

Sergio 接受《追光者》節目《Pulse Check》專訪時坦言,維持全港性財經資料庫遠超技術層面挑戰。David 過去曾自資投入超過港幣 1,000 萬元,並聘請全職助理處理繁複數據輸入工作 。David 在 2024 年嘗試推出「Webbipedia」群眾外包計劃 ,期望仿效維基百科模式由志願者協作維持運作,惟能夠長期貢獻高質量數據的參與者人數稀少,計劃最終無法持續 。這反映專業級金融資料庫難以單靠義工力量穩定營運 。

Sergio 強調網站核心價值來自數據本身,短期內不會大幅改動介面,最重要是保存現有數據、持續收集新資訊並確保準確性 。他計劃擴展更多資料集,讓公眾更容易獲取及使用這些數據。

人工審核成關鍵瓶頸

在眾多挑戰中,Sergio 認為「身份辨識」最為棘手。香港上市公司董事姓名重覆率高,加上英文姓名全寫與縮寫混用的情況普遍,純靠自動化系統無法準確分辨。團隊目前需要人手核對出生日期、履歷等資料進行交叉比對。Sergio 引用「Garbage In Garbage Out」原則指出,若缺乏嚴謹人工審核,錯誤數據將令資料庫失去公信力 。

香港企業資料欠缺機器可讀性

Sergio 發現香港在企業資料透明度方面明顯落後國際水平。許多上市公司公開資料僅保留 1 年,令長期歷史分析變得困難。相比之下,美國及全球超過 60 個國家已強制採用 XBRL(可擴展商業報告語言)格式 ,讓電腦系統能精準讀取財務數據。香港的「電子化」卻只是將紙本文件轉換為 PDF 及文字檔案上載,完全欠缺「機器可讀性」(Machine Readability)概念 。

Sergio 現正研究透過機器學習及半自動化工具提升數據處理效率,並計劃引入差餉物業估價署等政府部門公開數據,進一步充實網站內容。

資料來源:追光者 Pulse Check

 

Published by
Lawton