為確保學童有足夠睡眠 蘇州推「熔斷機制」功課未做完可豁免繳交

相信不少讀者都有聽過中國政府向未成年人士實施有關網絡遊戲時間的管制,就算是公眾假期期間,每日可以玩網絡遊戲的時間和時數都有所規限。原來對小朋友的規管並不局限於容易沉迷的網絡遊戲,就連做功課的時間,近期亦有地方教育局推出新的規管措施。

(閱讀全文…)

號稱德國芯片 Wi-Fi 訊號增強器 中國網民拆開發現只是小夜燈

近日微信公眾號 @芯片之家的一則帖文,引來了不少網民的熱烈討論和轉發。一名中國網民近日以 2.79 人民幣(約 2.98 港元)的價格,在某個電商平台購買了一個 Wi-Fi 訊號增強器,賣家聲稱裝置使用德國進口機芯、訊號可穿牆,並且擁有高達 9,999MB 速率。

(閱讀全文…)

美國增加中國太陽能原料關稅 多晶矽和太陽能晶片受影響

雖然美國即將進行政權輪替,不過中美貿易戰仍然未有停下步伐。美國政府最近宣佈將會大幅提高對中國太陽能原料的關稅,包括多晶矽、太陽能晶片和特定的鎢製品。
(閱讀全文…)

Adobe 新 AI 功能自動去除玻璃反射 即將加入到 Lightroom

無論是在博物館、觀景台還是商店外,隔着玻璃拍照總是會有麻煩的玻璃反射問題,Adobe 最近就推出一個 AI 新功能,可以自動去除玻璃反光。
(閱讀全文…)

Apple 通訊晶片傳明年推出 新款 HomePod mini 與 Apple TV 率先採用

Apple 在自家研發晶片方面已經獲得不少成功,不過在通訊晶片方面則仍然大部分依賴其他廠商。據消息透露,Apple 自家研發的藍牙和 Wi-Fi 通訊晶片有所突破,預計明年就會在產品中應用。
(閱讀全文…)

標籤:

訂閱新聞

Intel 可能分拆晶片製造業務 仍然視乎美國商務部審查

Intel 近來風波不斷,早前總裁 Pat Gelsinger 上週突然宣佈離職後,臨時共同總裁在一個會議上更暗示可能分拆製造部門,引起不小的關注。
(閱讀全文…)

Meta 加入阻止 OpenAI 營利化 「利用慈善資源謀取商業利益」

OpenAI 由非營利組織轉向營利機構的舉動引發爭議,繼 Elon Musk 入稟法院後,Meta 近日也向美國政府施壓,要求阻止 OpenAI 的營利化計劃。Meta 認為,這種轉型可能違背了非營利組織的初衷,並可能利用慈善資源謀取巨額商業利益。

 

OpenAI 於創立時定位為非營利研究機構,目標是開發能造福人類的人工智能技術。然而隨著科技發展及投資需求,OpenAI 採用雙結構模式:由非營利組織 OpenAI Inc. 管理其營利子公司 OpenAI Global LLC,營利子公司負責籌集和分配商業資金。OpenAI 行政總裁 Sam Altman 表示,持續投入龐大的研發資金對於吸引投資者和維持競爭力至關重要,因此不得不考慮捨棄非營利機構的身份。

 

Elon Musk 長期對 OpenAI 的營利化表示不滿。他強調當初成立 OpenAI 是為了維持技術開放和公益性,並於 2024 年 2 月提起訴訟,指控 OpenAI 背棄初衷,成為 Microsoft 的商業附屬公司。雖然該訴訟一度撤回,Musk 在 2024 年 8 月重新起訴,並在 12 月申請法院下達禁止 OpenAI 營利化的命令。

 

與此同時,Meta 在 12 月第二週向加州司法部長 Rob Bonta 發送請願書,敦促美國政府阻止 OpenAI 轉型為營利企業。Meta 指出,OpenAI 不應將以慈善名義積累的資產用於私人獲利,這種行為可能違反法律。Meta 支持 Musk 的立場,認為他有資格代表加州居民的利益反對 OpenAI 營利化。

 

Meta 警告,若 OpenAI 營利化成功,將為整個矽谷帶來衝擊,甚至改變科技初創公司的發展模式和競爭格局。營利化不單止關乎法律和道德,更涉及 AI 技術商業競爭的未來走向。Meta 自身正在加強 AI 研發,並計劃將其 AI 助理推廣至全球,競爭對手正是 OpenAI。

 

針對爭議,OpenAI 理事長 Brett Taylor 表示,OpenAI 理事會將專注於確保通用人工智能(AGI)造福全人類,履行其受託責任,堅守最初的使命。

 

 

資料來源:華爾街日報

 

 

====== 加入 unwire thread 傾傾科技背後黑暗事 ========

AI 輔助製作日本動畫 Twins Hinahima 95% 鏡頭運用 AI 協助改善勞動環境

由日本知名動漫零售商 Animate 旗下的 Frontier Works 與 KaKa Creation 聯合製作的動畫作品《ツインズひなひま》預定於 2025 年春季公開。該動畫透過 AI 技術協助製作達 95% 以上的動畫場景,期望改善動畫產業長期面臨的人手短缺和勞動環境問題,同時提升工作環境和生產效率。

 

《ツインズひなひま》是一次探討 AI 技術與動畫創作融合的實驗性專案,製作團隊利用 AI 技術將分鏡圖轉換為動畫素材,將實景照片轉化為動畫背景,並對 3D 模型進行手繪風格修飾。然而在作品的最後階段,仍由動畫師進行人工加筆和修正,以確保最終成品的質量達到專業標準。

 

▲人手繪畫線畫

▲再由 AI 完善

▲在背景加入真實相片

▲AI 轉換背景成動畫風

 

而在宣傳圖片製作方面,背景以實景照片經 AI 轉換成動畫風格,並經由美術團隊修正。至於角色和標誌設計,則完全由插畫軟件和動畫師親手繪製,保留傳統手繪工藝的細緻感。

 

 

Frontier Works 表示,現今動畫製作產業由於大量工作量,導致人手短缺和工作時間過長的問題日益嚴重。通過將 AI 作為輔助工具,期望能有效降低創作者的負擔,進而改善工作環境和創作者待遇。「透過《ツインズひなひま》這個專案,我們希望能成為業界改革的起點,緩解人手不足,提升生產效率,並為動畫師提供更可持續的工作條件。」Frontier Works 強調 AI 技術將有助於動畫產業邁向更光明和可持續的未來。

該項目由 KaKa Creation 提供技術支援,該公司專注於 AI 動畫製作,並擁有虛擬 TikToker「ツインズひなひま」的品牌。這對虛擬雙胞胎姐妹設定為東京某高中的學生,常於網上發布舞蹈短片,姊姊「ひまり」特徵是白髮,妹妹「ひなな」則為紅髮。

 

 

資料來源:ITMedia

iPhone 17 Air 或將取代 Plus 機款 傳設計已到 Foxconn 準備試產

台灣媒體《Digitimes》引述消息指,Apple 正在為 iPhone 17 Air 進行新產品導入階段(New Product Introduction Phase, NPI),預計將取代現有的 Plus 機款,並以更纖薄的設計為特色。

 

iPhone 17 Air 進入新產品導入(NPI)階段,這一階段的目標是將產品從概念轉化為大規模生產。NPI 過程包括設計驗證、原型測試、供應商資格認證及製造工序開發。試產階段會進一步測試組裝程序,完善質量控制,並確保供應鏈物流順暢,為最終全面生產做準備。

 

iPhone 17 Air 的螢幕大小預計介乎於 iPhone 17 Pro 和 17 Pro Max 之間。據多方消息來源,螢幕尺寸可能為 6.55 吋、6.6 吋或 6.65 吋,較 iPhone 17 Pro Max 略小,但比 iPhone 17 Pro 稍大。為了達到極致纖薄設計,Apple 可能會為 iPhone 17 Air 配備 4,800 萬像素的主相機,並將後置鏡頭從左上角移至機背中央。另外 iPhone 17 Air 有可能取消實體 SIM 卡槽,只支援 eSIM。

 

Apple 預計會在 iPhone 17 Air 中首次使用自家設計的 5G 晶片。這款晶片比 Qualcomm 的 5G 晶片更小,能與其他 Apple 自家設計的元件更緊密整合,節省機內空間。

 

資料來源:MacRumors, Digitimes

OpenAI 反擊馬斯克指控 指他「吃不到的葡萄是酸的」

OpenAI 與億萬富翁 Elon Musk 馬斯克之間的法律戰近日再升級。OpenAI 公佈了一系列與馬斯克的電郵往來,直指馬斯克針對該公司的訴訟內容具有誤導性,並指責馬斯克所謂的「非營利性使命」控訴不過是「吃不到葡萄是酸的」。根據這些電郵,馬斯克早於 2017 年曾建議將 OpenAI 轉型為營利性機構,但當他無法獲得控股權時便選擇退出。

 

今年 8 月 馬斯克重新對 OpenAI 提起訴訟,要求阻止 OpenAI 及其行政總裁 Sam Altman 的轉型計劃。馬斯克在訴訟中指控 OpenAI 已違背最初的非營利使命,並聲稱若不批准禁令,將對他及其 AI 公司 xAI 造成「無法彌補的傷害」。

 

然而 OpenAI 在最新法庭文件中回應,揭露馬斯克在 2017 年曾建議成立一個名為「Open Artificial Intelligence Technologies, Inc.」的營利性機構。根據電郵記錄,馬斯克當時提出要獲得 OpenAI 的控制權和大部分股權。當 OpenAI 聯合創辦人 Ilya Sutskever 拒絕了這一要求後,馬斯克選擇退出,並預言 OpenAI 將失敗。

 

退出 OpenAI 後,馬斯克於去年成立了競爭對手公司 xAI,並推出 AI 模型 Grok。該模型現用於馬斯克旗下社交平台 X(前身為 Twitter)的多項功能。雖然馬斯克指控 OpenAI 妨礙 xAI 獲取資金,但 xAI 於本月成功完成 50 億美元(約港幣 390 億元)融資,投資者包括 Andreessen Horowitz 和 Fidelity。xAI 現時的資金儲備高達 110 億美元(約港幣 858 億元),足以在全球 AI 市場上佔據一席之地。

 

馬斯克的法律團隊指控 OpenAI 與主要投資者微軟之間存在非法數據共享,並指出 Sam Altman 涉嫌自我交易。文件顯示,OpenAI 選擇了 Altman 擁有股權的支付平台 Stripe 作為支付處理商,令 Altman 獲得巨額收益。與此同時 Google 也要求調查微軟與 OpenAI 之間的合作關係。

 

OpenAI 在公開聲明中表示:「馬斯克無法透過訴訟獲得通用人工智能(AGI)。我們尊重馬斯克的成就,感謝他早期的貢獻,但競爭應該在市場上進行,而非法庭上。」

 

資料來源:AXIOS

 

波音延遲交付新「空軍一號」 特朗普未能在任內乘搭新總統專機

《華爾街日報》於週四引述知情人士指,由於建造兩架全新「空軍一號」總統專機的項目進度大幅落後,承辦商波音早前已經通知美國空軍,新「空軍一號」預計要到 2029 年或更後時間才能交付。這意味著快將第二次入主白宮的特朗普,在其任期內只能繼續使用舊的「空軍一號」。

(閱讀全文…)

政府修訂多項汽車功能規例 放寬遙控泊車、電子後鏡及車內播片限制

香港特別行政區政府刊憲多項道路交通相關修訂規例,運輸及物流局發言人指出修訂旨在配合國際車輛標準、科技發展及香港的路面情況,提升道路安全並促進新汽車科技在香港的應用。這些修訂規例將於十二月十八日提交立法會,進行先訂立後審議的程序,當中包括多項和新車配置的功能有關。

 

修訂規例提出多項建議包括: 1. 規定所有電動車必須安裝車輛聲響警報系統,以增強行人和其他道路使用者的安全;2. 運輸署將會允許駕駛者使用遙控泊車功能,提升泊車的靈活性和便利性;3. 放寬車箱內顯示器在車輛停泊時的播放限制,方便駕駛者操作; 4. 允許使用攝像鏡頭代替傳統反射鏡,並設定反射鏡及攝像鏡頭系統的具體規格;5. 容許電動商用車輛無需申領快速公路許可證,便可在快速公路上行駛,促進電動車商業運營的便捷性。

 

發言人補充道,政府將繼續審視科技發展及車輛操作要求,並適時更新規例,確保規範與不斷演變的車輛技術和國際標準保持一致。這些修訂規例反映了政府對業界發展的靈活配合,並積極考慮了不同持份者的意見,包括立法會交通事務委員會、交通諮詢委員會及業界代表等的建議。

 

來源: RTHK

中美續簽「中美科技合作協定」5 年 不涉及新興或關鍵技術

中美兩國於 2024 年 12 月 13 日簽署修訂版《中美科技合作協定》(U.S.-PRC Science and Technology Agreement STA),協定將由 2024 年 8 月 27 日起延長五年。這份協定為兩國政府間科技合作提供標準框架,修訂內容加入了多項保障措施,進一步鞏固雙方科技合作關係。

美國國務院表示,修訂後的協定強化知識產權保護,並為合作機構設立「護欄」,以保障研究人員安全及國家安全。同時,協定亦加入透明、互惠及數據共享等原則,冀能推進美國利益。美方特別指出,協定只涵蓋基礎研究範疇,不涉及新興或關鍵技術的發展。

《中美科技合作協定》最早於 1979 年簽署,旨在促進兩國於農業、太空及工程等領域的科技合作。這份協定是中美建交後首批簽署的政府間合作協定之一,每五年需要續簽一次。

修訂版協定在確保美國國家安全的前提下,保證所有科技合作符合美國利益,並減低潛在風險。協定的延長顯示出中美雙方在科技領域維持合作的意願,為未來兩國的科研交流奠定基礎。

 

來源:bloomberg

牌證易- 上網可看牌簿、車牌人牌、扣分紀錄及各許可證

政府新推出的「牌證易」平台,登入後可展示用戶持有的牌照資料、到期日、申請進度和結果。用戶在「智方便」系統登記後,即可隨時查閱駕駛執照的到期日、可駕駛車輛類別,以及違例駕駛記分紀錄。此外車主也可查看名下車輛及其牌照的到期日。平台亦提供續領提示服務,協助車主和駕駛者準時辦理牌照續期。

運輸署發言人表示:「我們鼓勵市民使用網上牌照服務,以減少親身前往牌照事務處。透過『牌證易』,登記車主和司機可以隨時管理名下的牌證,並利用續領提示功能,避免牌照過期帶來的不便。」

香港身份證持有人可利用「智方便」登記成為「牌證易」用戶,查閱牌照相關資料。至於非香港身份證持有人,例如護照或《往來港澳通行證》持有人,以及公司或機構,則可透過數碼證書或在運輸署登記的電子聯絡方式註冊帳戶。

運輸署預計在 2025 年第二季為「牌證易」增設更多功能。屆時,用戶可使用自動填表功能提交牌照申請,並查詢申請進度和結果。此外,平台亦會提供網上預約駕駛考試及查閱各類許可證資料的功能,為用戶提供更全面的電子服務體驗。

設定到期提示
能看到自己牌照及扣分紀錄,就算 2 年前的扣分紀錄一樣可看到
按下車輛後可以進入詳細的「牌簿」頁面,去車房報零件時不用次次找實體牌簿。

 

小米汽車籌備國際銷售團隊 為進軍海外市場做好準備

早前公開第二款電動車 YU7 的小米,據報正準備將其電動車業務由中國大陸,進一步擴展至海外市場,並且已經將目標鎖定在多個海外地區。小米於今年年初於中國開賣首款電動房車 SU7,而第二款 YU7 則為電動 SUV,預計明年夏季會正式推出。消息指小米正籌組一支負責國際銷售的團隊,工作包括市場調查研究、項目管理和售後服務支援。

(閱讀全文…)

一改系統支援欠佳作風 Motorola 宣佈為多款手機提供 5 年系統更新

曾經有一段很長的時間,Motorola 的手機軟件更新被用戶狠批表現欠佳,就算是旗艦級高階手機,該品牌亦最多只會提供三次 Android 系統更新,而中階和入門級手機則可能只獲得兩次,甚至是一次的升級,絕大多數入門級型號,Motorola 甚至完全沒有提供任何系統更新承諾。

(閱讀全文…)

Meta 捐贈一百萬美元予特朗普 外界猜測向特朗普求和

Meta(Facebook 母公司)近日宣布將向特朗普的就職基金捐款 100 萬美元(約港幣 780 萬),顯示 Mark Zuckerberg 正在積極修補與美國右翼的關係。自 Meta 封鎖特朗普帳戶以來,兩者的矛盾未曾完全解決。是次捐款正值特朗普於 2024 年 11 月在 Mar-a-Lago (海湖莊園)與 Mark Zuckerberg 共進晚宴後,引發外界關注 Meta 政治意圖。

 

Meta 發言人 Andy Stone 確認公司向特朗普就職基金捐款,並表示這是 Mark Zuckerberg 針對即將上任的特朗普政府所採取的一項策略,顯示出 Meta 有意修復與特朗普陣營關係。特朗普與 Mark Zuckerberg 及其社交網絡 Facebook 以往積怨甚深,2017 年特朗普甚至稱 Facebook 是「反特朗普(anti-Trump」平台。其後 2021 年 Facebook 及 Instagram 以「煽動 1 月 6 日國會山莊騷亂」事件為理由暫停特朗普的帳戶。隨後同年 3 月 特朗普指控 Facebook 為「人民公敵(enemy of the people)」。特朗普其後在今年 9 月表示,如果 Mark Zuckerberg 試圖干擾 2024 年美國大選,下半生將會身陷囹圄,在監獄渡過餘生。

 

Meta 宣布捐款時間與 Mark Zuckerberg 和特朗普在海湖莊園晚宴時間相隔不遠,使外界揣測 Mark Zuckerberg 是否要修復與美國右翼的關係。自特朗普卸任總統以來,Mark Zuckerberg 及 Meta 一直面臨來自右翼的強烈批評,特別是在 2020 年大選期間,Meta 及其他社交平台封鎖特朗普的言論,被右翼視為言論打壓,並激起了特朗普及其支持者的強烈不滿。特朗普重返政壇使得 Meta 不得不面對與右翼的歷史性緊張關係。對 Mark Zuckerberg 而言,這筆捐款不僅是基於商業考量,更是為了修復與保守派的合作關係,並為 Meta 在特朗普領導下的政府中爭取更多支持,為雙方未來的合作創造更多機會。

 

圖片來源:Donald J.Trump@Facebook

資料來源:AP NewsBBCCBS NewsNBC NewsWashington Post

科技券將於年底停止申請 政府認為已達成最初成立目的

政府在 2016 年透過「創新及科技基金」推出「科技券」,資助本地企業/機構使用科技服務和方案,時隔 8 年終於宣佈結束計劃,年底將會停止接受申請。
(閱讀全文…)

【TGA 2024】四大新作預告片公開 《巫師 4》、《邊境禁地 4》等重磅大作齊發

在今日舉行的 2024 年遊戲大獎(The Game Awards)中,除了讓人回顧今年的優秀遊戲外,遊戲廠商也趁機會公佈大作,其中《巫師》、《邊緣禁地》、《四海兄弟》和《文明帝國》的最新續作也有全新預告片公開。
(閱讀全文…)

【教學】MacWhisper 語音轉錄文字 AI 工具   本地 AI 模型處理 + 支援廣東話、多國語言 + 輸出字幕檔

之前你睇 YouTube 影片好多自動產生的中文字幕都古靈精怪,錯漏百出。AI 工具發展迅速,現在要將錄音轉換文字變得更輕易,而且更加準確。今次介紹 MacWhisper 是一款基於 OpenAI Whisper 技術的語音轉文字工具,特別適合需要處理大量錄音檔的使用者。 它能夠辨識超過 100 種語言,包括中文和英文,並將音訊檔案、YouTube 語音、甚至即時錄音轉換為文字。軟件好處是運用 AI 大模型辨識語音內容,辨識準確度大大提升之餘,軟件更是在你的電腦上運行這些大模型,資料毋須上傳互聯網,保障你的個人私隱、企業機密。

 

 

 

MacWhisper 支援多種音訊格式,如 MP3、WAV、M4A、MP4 和 MOV,使用者只需將音訊檔案拖放至應用程式,即可開始轉錄。 MacWhisper 更可讀取 YouTube 網址,即時轉錄 YouTube 外語、廣東話、中文影片,還具備即時錄音功能,適合用於會議記錄轉錄文字之用。MacWhisper 提供免費版和付費版。 免費版包含 Tiny、Base 和 Small 三種模型,轉換速度較快,但準確率相對較低;付費版則增加了 Medium 和 Large 模型,雖然轉換速度較慢,但準確率有顯著提升。 

 

 

應用場景:

語音轉錄文字功能,非常適合經常要處理文字、從文字中獲取資料的朋友,例如:

・人物訪談--將訪問錄音轉換成文字,方便後續處理

・會議記錄--會議完成後內容可一目了然,甚至可再用AI總結

・學習--將老師課堂轉換成文字,之後用AI總結

・語言學習--將外語轉化成文字,方便學習外語

・總結YouTube影片--將外語YouTube影片轉換文字再翻譯,幫你輕鬆整理資料

・備忘--將重要記事轉換成文字

・拍攝影片後需要製作字幕--不用自己打字幕

・多國語言交流

 

MacWhisper 收費版可使用大型 AI 語言模型,而免費版就可使用它的基本功能。軟件提供學生、媒體優惠,選擇學生或媒體記者可以用 29 歐元(約港幣HK$238)購買一個授權。

官方網站:https://goodsnooze.gumroad.com/l/macwhisper

 

 

下載語音轉換 AI 模型

MacWhisper 支援電腦本地語音轉文字,也就是說無需將音訊上傳到網絡,即可在電腦上完成所有轉錄工作。有效保護個人私隱和企業機密,特別適合需要處理敏感資訊的用戶。在第一次使用時,你要下載 AI 模型,而日後也可透過設定選單來加入。

 

在模型列表中,你會看到不同版本的模型,每個模型旁邊都有「Quality」和「Speed」指標,例如:

  • Large V3 (3.1 GB):準確度最高,但轉錄速度稍慢。
  • Turbo (OpenAI) (1.6 GB):速度較快,但準確度略低。

 

▲較大的模型處理上需要較大的電腦效能,或需要更多時間

▲較小的模型處理速度可以更快,但有時候可能影響文字辨識的準繩度

 

點擊 「Download」 按鈕開始下載。確保你的電腦有足夠的儲存空間,因為大型模型如 Large V3 需要大約 3.1 GB 空間。下載後的模型將存儲在本地,即可隨時使用。

 

 

實際應用 1:將音訊檔案、YouTube 音訊轉錄成文字

MacWhisper 支援多種音訊格式,如 MP3、WAV、M4A、MP4 和 MOV,使用者只需將音訊檔案拖放至應用程式,即可開始轉錄。 用戶也可直接輸入YouTube連結或預先下載YouTube影片聲音檔,放入 MacWhisper 轉錄成文字。好處是無需 CC 字幕,即使影片沒有內建字幕,MacWhisper 也能識別語音並轉錄成文字,更支援廣東話轉錄。

Step 1

首先第一步請先選擇文字轉錄 AI 模型。點擊右上角的模型選單。根據需求選擇合適的模型:

  • Large v3:只有這個模型才支援廣東話,如有需要請用這個
  • Distil Large v3 (English Only):準確度高,適合英文、長篇內容。
  • Small:速度較快,但準確度稍低。

 

▲先選取 AI 模型,今次選取可以處理廣東話的「Large v3」模型

▲再選擇語言,直接選取廣東話,會比自動偵測效果更好

 

Step 2

在 MacWhisper 主畫面中,找到 URL 輸入框,貼上 YouTube 影片連結。如果你準備好語音檔案,可將之拖放到 MacWhisper 視窗。按下「Transcribe」按鈕即時轉錄文字。如果你所持的媒體是語音檔案,例如 MP3/WAV/M4A 的話,就按「Open Files」讀取這些檔案。

 

▲這次我們嘗試將一段廣東話語音,但 CC 字幕是白話文的影片,利用 MacWhisper 轉錄廣東話口語文字

 

Step 3

很多 YouTube 影片的自動字幕(CC 字幕)往往以書面白話文顯示,而非真正的廣東話口語。MacWhisper 提供強大的廣東話轉寫功能,幫助用戶將影片或音訊內容轉錄成真正的廣東話,並可輸出香港字、中間夾雜的英文。但有些同音字可能出現誤差。例如「傳輸速度」變成了「全書速度」,英文字也可能有誤差,例如 M、N 等,有時需要你在轉錄後自行覆核,或者後續放到 AI 處理這些錯誤。

 

▲有些同音字需要自行覆核,不過還好出現錯誤的頻度還不是很多

 

另外我們也嘗試用英文大模型去轉錄 YouTube 影片的文字。發現英文模型準確度非常高,有時比起 YouTube 內置的轉錄功能更加準確。如果你極有語音轉錄的需要,MacWhisper 便是一個你很值得的投資。

 

 

輸出成 SRT 字幕檔案

轉錄完成後,轉錄文字結果可輸出成字幕檔。MacWhisper 支援 SRT、VTT、MD 格式字幕檔,亦可輸出成 Dote 動態文字處理的 script。輸出的檔案可作後續用途。但我們測試後發現有時程式不一定能成功分句,有時一大段文字會變成一句,用家需自行再調整。

 

 

實際應用 2: 將系統聲音錄音並轉換成文字

MacWhisper 支援錄取 Mac 電腦的系統聲音,或指定應用程式的聲音,並將音訊即時轉錄成文字。這項功能不單能使用於視像或電話會議,還適合各種不同應用場景,例如:網上課程、影片播放、Podcast 等。它支援 Mac 電腦任何播放音訊的 App,錄製 Mac 系統內音訊內容,記錄筆記或保存資料。

 

 

測試:錄音 Zoom 視像會議,轉錄成為文字

Step 1

以下會示範將 Zoom 視像會議的內容轉換成文字。首先打開 MacWhisper 並在主頁啟動「Record System Audio」功能。

 

 

Step 2

選擇錄音來源。如需錄取整個系統音訊:選擇 「Record All System Audio」。如指定 App 錄音:選擇特定應用程式,例如 ZoomSafariYouTubeNotes 等。開始錄音。點擊 「Record [App Name]」 按鈕開始錄音。錄音進行中時,MacWhisper 將即時轉錄音訊內容。

 

Step 3

停止錄音並查看轉錄結果。點擊 「Stop」 完成錄音,系統會自動顯示轉錄文字。你可看到整個會議的內容會轉換成為文字。

 

AI 摘要功能

在轉錄完成後,使用 MacWhisper 的 AI 功能生成摘要,快速提取關鍵資訊。

 

▲這是最初測試的 YouTube 影片,轉錄文字後都可用 AI 摘要

 

初始設定 AI 摘要功能

MacWhisper 內置強大 AI 功能(用戶需自備有 AI 帳戶,例如 OpenAI, Gemini),可以在轉錄文字後生成摘要、重點提取,甚至翻譯內容。要啟用這些功能,必須先設定 AI 服務並提供 API Key。只要設定一次,你的 MacWhisper 便能連接 AI 引擎。

 

 

Step 1

在 MacWhisper 主畫面,點擊左側功能欄的 「AI Services」。你可以選擇不同的 AI 服務商,例如:OpenAI、Anthropic、Google、Groq、Azure 等,選取後按 Configure 按鈕;

 

Step 2

以 OpenAI 為例,請按照以下步驟取得 API Key。登入 OpenAI 官方網站,進入 「API keys」 頁面,點擊 「Create new secret key」,然後複製生成的 API Key。

 

 

Step 3

回到 MacWhisper 的設定畫面,將複製的 API Key 貼入輸入框,然後點擊 「Done」 確認設定。

 

AI 摘要應用:總結 YouTube 影片內容

有時外語影片十分之長,花十多廿分鐘去聽,也不一定能理解內容。而有了 AI 摘要,就能先用 MacWhisper 轉錄影片,然後用 AI 翻譯並為你寫出摘要,你只要花 1、2 分鐘就能吸收影片中的內容。

 

 

MacWhisper 所有功能都能使用 AI。例如這次轉錄了一段 YouTube 影片。它是介紹兩部相機的分別,以及介紹如何選擇相機。

 

▲今次設定了使用英文的 AI 轉錄模型

▲將影片的 YouTube 網址輸入到 MacWhisper 文字欄位便可。

▲首先我們會得到英文的文字轉錄

 

只要你完成文字轉錄,就可打開 AI 選單。設定到 AI Service 後,按一下「Summary」便可輸出摘要。我們建議你在下方輸入特別要求,例如圖中「Please use Traditional Chinese」令 AI 懂得將任何語言的影片,都輸出繁體中文摘要。

 

▲切換到 AI 處理頁面,設定好使用的 AI 服務,並寫入摘要時 AI 要注意的地方。最後便能輸出你需要的影片摘要

 

 

實際應用 3:電腦咪高鋒即時轉錄文字

MacWhisper 具有電腦咪高鋒即時錄音,並即時轉換文字的功能。程式放置了一個圖示在畫面右上方的系統選單列。點擊按鈕,設定好 AI 模型按「Record」就可開始錄音,錄音完成後,收音的文字會轉錄成為文字。


▲操作方法:按動 MacWhisper 圖示,在彈出的選單中設定好 AI 模型,再按錄音按鈕;

▲開始錄音後,就可對著電腦說話,或者收音▲錄音完成後輸出的文字

 

實際應用 4:實時 AI 處理的語音輸入功能

MacWhisper 提供一個結合 AI 的 Dictation 文字讀取功能,即時將你的語音轉換成文字,兼實時進行 AI 處理。此功能可用來發送訊息之用。實際操作上,只要按住事先設定好的快捷鍵,例如按住 Fn 按鍵,就可觸動語音輸入,放手之後,就可將語音內容變成文字輸入。

 

▲從 App 主頁打開 Dictation 讀寫功能,設定一個快捷鍵

▲按住快捷鍵再讀寫

▲放手後,就可輸出讀寫出來的文字

 

語音輸入更可結合 AI 處理。在程式選單中,輸入你想 AI 為你做的事,例如筆者輸入了「將口語轉換成白話文」,並將之設定成 Active Prompt。然後我在語音輸入後,小編向著咪高鋒說出「你好,唔該你幫我整返好部電腦」,AI 處理後便會將我的說話變成了白話文輸入到文字欄。

 

▲先打開設定畫面的「Dictation」選單,加入你的 AI 指令,並設定成為 Active Prompt

▲結合 AI,將口語變成白話文

 

 

總結:處理文字者非常不錯的投資

如果你的工作是需要隨時整理文字,例如利用錄音筆記錄資料、記者將訪問變成文字稿,甚至是同學們在網上課程中錄音,MacWhisper 都是一個極可靠的文字轉錄工具。重點是它的處理都在電腦內進行,毋須將含有私密資料的錄音上傳互聯網,加強資料的保密性。此 App 屬於一次性付費,如以學生或記者身份購買的話更有特價,雖然最平都要二百多元,但屬於不錯的投資。