數碼時代,手機與電腦雖然方便,但紙筆的溫度與習慣仍然存在。不論是為了自我管理,還是教育小朋友養成記帳習慣,隨手錄下的手帳、或者是一疊舊筆記,都是珍貴的數據資料。然而,事後要逐項將這些手寫內容輸入到 Excel 進行統計,往往令人卻步。今日,Google Gemini 的 OCR 辨識能力已經進化到連潦草的手寫字都能精確捕捉。我們將實測如何利用 Gemini 作為橋樑,連繫紙筆情結與數碼效率,並示範兩個最實用的場景。
▲ Gemini 將手寫的記帳內容轉到 Excel 表
今次實測的場景是大家生活最常接觸的「記帳」。不論是大人忙碌工作間的碎雜開支,還是小朋友初學理財的小帳本,紙筆記錄往往是最即時、最直覺的做法。
筆者坦言,除了簽名之外,已經很久沒有拿起筆認真寫字,字體結構相當混亂,甚至有些筆劃已經糊成一團。我們隨手在一張白紙上模擬了五日的開支,故意混合了「3月23日」、「Mon」等日期寫法,還有中英夾雜的項目。
▲由於很久沒有拿起筆認真寫字,字體相當混亂
▲筆記記錄了過去五天的消費,字體混亂,甚至有些筆劃已經糊成一團
我們將這張照片直接上傳給 Google Gemini,為了效果更好,可以把思考模式設定為「思考型」。
之後,我們可以輸入一個明確指令(Prompt),讀者們可以直接複製貼上指令:「請辨識圖中的手寫資料,提取日期、項目內容、金額三個欄位。請將日期統一格式為 YYYY-MM-DD,並以 Markdown 表格輸出,方便我貼到 Excel。」
▲ 上傳手寫記帳圖片,並貼上我們提供的指令:「請辨識圖中的手寫資料,提取日期、項目內容、金額三個欄位。請將日期統一格式為 YYYY-MM-DD,並以 Markdown 表格輸出,方便我貼到 Excel」
事實上,由於 Gemini 非常聰明,即使你寫更簡單的指令,例如「以上是我過去五日的手帳筆記,把它轉到Excel檔」,Gemini 也可以做到。
辨識結果令人驚訝。即使記者的字跡相當難讀,Gemini 依然能準確捕捉到「巴士 $10.3」這些帶有小數點的瑣碎數字,並自動補齊年份和月份。這種辨識能力對於需要處理大量舊收據,或者想將小朋友那本字跡歪歪斜斜的記帳本電子化的家長來說,簡直是救星,完美解決了手動輸入的痛苦。
很多人以為要把 AI 產生的表格放進 Excel 是一件很麻煩的事,其實 Gemini 已經內建了無縫接軌的功能。當 Gemini 產生出整齊的表格後,你會發現表格下方有一個「匯出至試算表」的按鈕。點擊下去,系統就會自動為你建立一個全新的 Google Sheet( Google 的 Excel ),並將所有數據完美排列好。
▲ 表格下方有一個「匯出至試算表」的按鈕
如果你習慣使用傳統的 Excel 軟件,只需在該 Google Sheet 的左上角點選「檔案」(File)>「下載」(Download),然後選擇「Microsoft Excel (.xlsx)」。這樣,你剛才那疊手寫紀錄就已經變成了一個專業的 Excel 檔案,完全不需要手動調整格式,更不會出現複製貼上時常見的亂碼或錯位。這種自動化流程,對於不熟悉電腦操作的人來說也毫無難度。
▲ 點選「檔案」(File)>「下載」(Download),然後選擇「Microsoft Excel (.xlsx)」
數據成功進入 Google 試算表後,我們最後一關就是計算這一週到底花了多少錢。既然是使用試算表功能,你只需要用滑鼠選取「金額」那一欄所有的數字,然後直接望向 Excel 視窗最右下角的狀態列,你會在那裡發現一個寫著「總和」的小框,旁邊顯示的數字就是你這一週的總支出。這個方法最適合只是想快速看一眼結果的讀者。
▲ 使用試算表的計算功能
當然,亦可以利用 Gemini 進一步整理數據,例如按類別計算幾天的總支出:
除了計數,Gemini 處理文字筆記同樣出色,亦可以輸出到 Google Doc。最簡單的例子就是我們隨手寫下的「待辦清單(To-Do List)」。
筆者今次模擬了一份包含私人事務、工作聯絡及醫療預約的雜亂筆記,內容包括電話及電郵地址,字體同樣是非常潦草:
【筆記內容參考】:
打俾 Daniel (9234 6512),話今日去唔到 GYM
Email Patrick (PatrickYip@gmail.com) 同佢講可以做 MC,Expected salary: $10,000 / per show
搵營養師 Sandy (6111 2222),Book 4/4 16:00 睇
拎順豐 (Code: 852M11423467),地點:觀塘廣場
陳生 (老細個仔,9123 4567),寫報價單俾會計 (account@ac.com)
▲ 手寫筆記包含私人事務、工作聯絡及醫療預約的雜亂筆記
步驟一:我們可以開啟「Canvas」功能,以確保轉寫內容更容易輸出到 Google Doc ,以及如果內容有錯,可以修改輸出的內容。如果讀者們不熟悉「Canvas」功能,可以閱讀我們的 Gemini 懶人包。
▲ 上傳手寫筆記圖片,並貼上我們提供的指令:「將呢份手寫 To Do List 轉成文字,輸出到 Google Doc」
步驟二:當你上傳手寫筆記圖片後,只需貼上指令:「將呢份手寫 To Do List 轉成文字,輸出到 Google Docs。」Gemini 就會自動幫你排版,將凌亂的手寫字變成整齊的電子文件。這對平時懶得打字,或者想將隨手寫下的構思快速變成長篇文稿的人來說,確實非常方便。
▲ 使用 Canvas 功能所輸出的結果
▲ 在 Canvas 頁面,便可以直接輸出到 Google Doc,不論是電話或電腦界面的 Gemini 也有這個功能。
透過這次實測,我們看到 Gemini 不單具備強大的文字辨識能力,更能理解數據背後的邏輯與格式要求。這套流程連接了傳統紙筆習慣與現代效率,讓我們可以保留紙筆觸感,同時享受數據分析帶來的便利。