以往好多朋友都希望 YouTube 影片,或者錄音檔案可以轉成文字稿。其實坊間都有不少轉錄文字的程式。但今次介紹的 Google Gemini 神功能,就是能夠直接將錄音檔案轉成文字稿,而且能輸出你喜歡的語言,更可即時應用 AI 總結、找重點、問問題等。不論免費版或者 Pro 版,你都可以應用本教學介紹的語音轉錄功能。


▲不靠 YouTube 字幕功能,只要你的影片有聲,就可轉錄成文字稿,對於沒有內置 CC 字幕的影片都同樣有效
會議/課堂錄音懶得由頭再聽?Gemini 幫你 1 分鐘內轉 20 分鐘內容做文字
語音轉錄,最常用的情景就是記錄會議內容、訪談資料,又或者同學們上課記錄老師授課內容,轉錄功能可將語音檔案的內容,轉換成為文字,可給你用作往後其他用途。轉錄功能除了解決逐字稿撰寫的工作外,AI 更可為你重點摘要、查找特定片段,更可轉換出各式報告。對上班族、學生、創作者而言,都是極好用的功能。
今次我們就先介紹下,將 YouTube 影片轉錄成文字稿。如果你已經有錄音檔案,可跳過,直接去看 Gemini 語音轉錄功能的介紹。

(雖然我們的 YouTube 影片都有字幕,但今次僅作示範用途。)
將無字幕 YouTube 影片轉錄逐字稿
雖然 YouTube 字幕功能已很普遍,但總會有些影片是無字幕提供的。這時候,可用本教學的方法來製作逐字稿。我們先將影片的音訊內容下載到你的電腦/手機。

▲點擊影片的「分享」功能,複製影片的網址
連上 yt1z.net 等這類網站,將影片網址貼上,便可以下載這段影片的聲音檔案。這個聲音檔案將留作 Google Gemini 處理之用。


▲在轉換網站貼上網址,便可得到聲音檔案。但請留意影片版權,避免侵犯他人著作權。
用 Gemini 將錄音轉成逐字稿
使用 Gemini 轉錄錄音的整體流程簡單,但香港用戶要使用 Gemini,必需通過 VPN 連線(連接香港以外的 VPN 伺服器)才可使用。

當你用了 VPN 連上 Google Gemini,就可上傳音訊檔案。上傳後,你可在提示詞欄位輸入「請為我將聲音檔案生成完整的文字稿」(你可根據需要,自由更改這句提示詞)。

Gemini 在不到 1 分鐘的時間內,便成功完成轉錄,並呈現清晰的中文逐字內容。這種速度與準確度,對於需要快速掌握會議、課堂或採訪內容的人來說,是一大助力。我們這次測試的 YouTube 影片聲音檔案,都可順利轉錄成中文文字稿。

不只是逐字稿:內容摘要與問答也難不倒 Gemini
完成轉錄後,Gemini 並不僅止於提供原始文字,還能繼續進行更深入的分析。例如你可輸入提示詞:「請幫我列出逐字稿的內容摘要與重點」。Gemini 回應的內容,彙整重要章節與關鍵語句,依照內容主題分類出數個要點,使得整體資訊一目了然。這個功能適合需要撰寫會議紀錄,又或者課堂後想整理學習筆記的用家。
例如我這次測試的影片,是一段開箱 iPhone 的影片,Gemini 便會為我總結影片內出現的內容。

更進階應用:向影片內容發出問題
除了基本的逐字稿與問答應用外,你更可透過 Gemini 詢問關於影片/錄音內容。例如這次我們的影片是關於 iPhone 開箱的內容。你就可直接問:「主持人覺得 iPhone 17 Pro Max 最大優點是甚麼」,Gemini 便會為你找出你需要的內容,並以文字段落或列點表示。對學習中的同學仔來說,此功能讓你可在一大段課堂內容中,找出你想復習的內容。對於工作人士來說,也可從冗長會議記錄中,找出你關心的話題。

請留意免費與付費版本的差異
之前提過免費版 Gemini 都可用到文字轉錄功能,但是免費版與 Pro/Ultra 版用戶的使用限制都有所不同。:
- 免費帳戶:每次最多上傳 10 分鐘的音訊,檔案大小限制為 100MB,上下文處理上限為 32K tokens。
- Pro / Ultra 用戶:可處理長達 3 小時的錄音,上下文支援高達 1M tokens,能進行更深入與完整的語意分析。
總結:Gemini 會是你的錄音筆記幫手
Gemini 的錄音轉逐字稿功能是一項相當實用的 AI 工具,能協助用戶快速完成文字轉錄,更能進一步分析重點、整理摘要、進行互動式問答。可惜我是目前 Gemini 未能生成正確的字幕檔(生成後時間會亂作一團),我們期待 Google 可繼續完善這個功能。
分享到 :
最新影片