現今雖然已經有不少語音轉文字的免費工具,可以將開會、演講等錄音快速轉成逐字稿,但大多都是手機 App 版本,如:雅婷逐字稿,線上工具也有,但基本上都要收費,這篇就要推薦一個 Mac 版且基於 OpenAI Whisper 開發的 MacWhisper 免費工具,支援多種檔案格式,包括影片格式,甚至連 YouTube 影片也沒問題(但只有 MacWhisper Pro 可用)。
MacWhisper 透過 AI 來幫你語音轉文字的免費工具,基於 OpenAI Whisper
MacWhisper 是一款由 Jordi Bruin 開發的免費工具,沒在 App Store 上架,需要到開發者頁面中取得。進到軟體介紹頁面後,點擊右側的 MacWhisper,也就是 0 元那一個,Pro 付費版可使用完整功能,包括速度更快的模型和 YouTube:
需要填寫電子郵件地址,填完之後按獲取:
接著就會獲得軟體載點和序號,但序號好像不用輸入,軟體下載後可以直接使用(我是這樣):
下載後打開,因為是從網路上下載的工具,首次打開會跳出這訊息,按打開:
接著選擇你要下載使用的模型,上方是支援多國語言(Multiple Languages),包括繁體中文,下方則是只有英文(English Only),而免費用戶的多國語言只能使用 Tiny、Base 和 Small,Small 的準確度最高但速度適中,不是最快,這我是覺得還好,我測試 15 分鐘左右的影片,大概 1 分 10 秒就完成,還可以接受:
既然模型需要下載,那也代表這個 AI 語音轉文字動作,都是在本地完成,不需要上傳到伺服器之類,就安全性來說相當不錯。
下載好後會移到上方,不滿意的話也能按 Delete 手動刪除:
下圖就是軟體介面,支援 YouTube URL 網址、打開檔案(直接拖曳到視窗也沒問題)、以及新的錄製活動。檔案部分支援 MP3、WAV、M4A、MP4 和 MOV 格式:
YouTube 網址目前僅支援 Pro 付費會員,免費會員轉換時會跳出這訊息:
另外如果你改用本地檔案,卻一樣跳出這個訊息的話,請重開軟體,重開就能解決。
我測試 15 分鐘檔案,1 分多鐘就完成。有一點要注意是,目前中文的檔案名稱還不支援,如果你要轉換成文字的檔案名稱有中文,會顯示格式不支援的狀況,這改成數字或英文即可解決:
Small 的準確度我覺得就很不錯了,雖然不是 100%,但至少還是有 95%,這也意味著轉好之後記得要檢查一下,滑鼠移到該段文字上方,右邊會出現功能表,按播放即可聆聽講的話是不是真這樣,有錯的話按 A:
就能手動修改成對的文字:
沒問題按右上角輸出(Expert),可輸出成常見的文字檔,包括 SRT、VTT、Text、CSV 等,HTML 和 PDF 僅限 Pro 付費版用戶使用:
Text 會自動把時間戳刪除:
轉換語言預設為自動,這基本上不需要調整,除非碰到精準度不夠高的情況,就可以手動改成指定語言:
New Recording 需要取用麥克風: