以往好多朋友都希望 YouTube 影片,或者錄音檔案可以轉成文字稿。其實坊間都有不少轉錄文字的程式。但今次介紹的 Google Gemini 神功能,就是能夠直接將錄音檔案轉成文字稿,而且能輸出你喜歡的語言,更可即時應用 AI 總結、找重點、問問題等。不論免費版或者 Pro 版,你都可以應用本教學介紹的語音轉錄功能。
▲不靠 YouTube 字幕功能,只要你的影片有聲,就可轉錄成文字稿,對於沒有內置 CC 字幕的影片都同樣有效
語音轉錄,最常用的情景就是記錄會議內容、訪談資料,又或者同學們上課記錄老師授課內容,轉錄功能可將語音檔案的內容,轉換成為文字,可給你用作往後其他用途。轉錄功能除了解決逐字稿撰寫的工作外,AI 更可為你重點摘要、查找特定片段,更可轉換出各式報告。對上班族、學生、創作者而言,都是極好用的功能。
今次我們就先介紹下,將 YouTube 影片轉錄成文字稿。如果你已經有錄音檔案,可跳過,直接去看 Gemini 語音轉錄功能的介紹。
(雖然我們的 YouTube 影片都有字幕,但今次僅作示範用途。)
雖然 YouTube 字幕功能已很普遍,但總會有些影片是無字幕提供的。這時候,可用本教學的方法來製作逐字稿。我們先將影片的音訊內容下載到你的電腦/手機。
▲點擊影片的「分享」功能,複製影片的網址
連上 yt1z.net 等這類網站,將影片網址貼上,便可以下載這段影片的聲音檔案。這個聲音檔案將留作 Google Gemini 處理之用。
▲在轉換網站貼上網址,便可得到聲音檔案。但請留意影片版權,避免侵犯他人著作權。
使用 Gemini 轉錄錄音的整體流程簡單,但香港用戶要使用 Gemini,必需通過 VPN 連線(連接香港以外的 VPN 伺服器)才可使用。
當你用了 VPN 連上 Google Gemini,就可上傳音訊檔案。上傳後,你可在提示詞欄位輸入「請為我將聲音檔案生成完整的文字稿」(你可根據需要,自由更改這句提示詞)。
Gemini 在不到 1 分鐘的時間內,便成功完成轉錄,並呈現清晰的中文逐字內容。這種速度與準確度,對於需要快速掌握會議、課堂或採訪內容的人來說,是一大助力。我們這次測試的 YouTube 影片聲音檔案,都可順利轉錄成中文文字稿。
完成轉錄後,Gemini 並不僅止於提供原始文字,還能繼續進行更深入的分析。例如你可輸入提示詞:「請幫我列出逐字稿的內容摘要與重點」。Gemini 回應的內容,彙整重要章節與關鍵語句,依照內容主題分類出數個要點,使得整體資訊一目了然。這個功能適合需要撰寫會議紀錄,又或者課堂後想整理學習筆記的用家。
例如我這次測試的影片,是一段開箱 iPhone 的影片,Gemini 便會為我總結影片內出現的內容。
除了基本的逐字稿與問答應用外,你更可透過 Gemini 詢問關於影片/錄音內容。例如這次我們的影片是關於 iPhone 開箱的內容。你就可直接問:「主持人覺得 iPhone 17 Pro Max 最大優點是甚麼」,Gemini 便會為你找出你需要的內容,並以文字段落或列點表示。對學習中的同學仔來說,此功能讓你可在一大段課堂內容中,找出你想復習的內容。對於工作人士來說,也可從冗長會議記錄中,找出你關心的話題。
之前提過免費版 Gemini 都可用到文字轉錄功能,但是免費版與 Pro/Ultra 版用戶的使用限制都有所不同。:
Gemini 的錄音轉逐字稿功能是一項相當實用的 AI 工具,能協助用戶快速完成文字轉錄,更能進一步分析重點、整理摘要、進行互動式問答。可惜我是目前 Gemini 未能生成正確的字幕檔(生成後時間會亂作一團),我們期待 Google 可繼續完善這個功能。