尋矽谷@HK:來上一堂大數據分析

Published by
Loki Ng

最近正在幫一個有著千萬用戶級別的產品處理國際化的流程,每天產生的數據都是人腦無法處理的級別,所以我的任務就是需要從數據中篩選出有用的資訊,再加以改進。

我非常相信統計學,所以更明白樣本數量的重要性。數據在大得可以被分析前,只能是一堆雜訊(Noise),因為無法判斷到底樣本能否代表整體表現,盲目跟從頗為危險。

而上一個處理的產品活躍客戶數量少,才百多兩百個,加上每個的需求不盡相同,一直覺得數據能幫的不多,所以團隊非常依賴跟用戶聊天。這也是為甚麼很多成功的團隊早期都特別注重和用戶的溝通,比起小數據,讓用戶直接說話更為有用。

除了準確程度,取得數據上的時間也是一個很重要的因素,在產品尚未成熟前除了某些大方向外(比如用戶數或收入),很難訂立更仔細的數據--常常有個情況就是訂立了數據,花了時間獲取,因為早期的產品變化太快,然後那個數據已經沒甚麼用了。

到後期產品和數據都成長到人無法處理的時候,解析大數據才有了意義--無論是準確度或穩定性都應該比早期產品更為適合。

大數據的話題常讓不同團隊一頭撞進了用數據說話的迷思,可在數據長大前,聽人說話、讓人去判斷才是最有效率的方法--要不創辦人比起加入才三個月的新成員能有甚麼特別?

作者 Loki Ng 深信沒有懷才不遇,只是大家還未遇上,他的 Startup 點滴

Published by
Loki Ng