這一兩年來「AI」已經成為許多科技人生活中的主旋律,但對一般人來說 AI 的使用面其實並不多,就是偶而跟 ChatGPT 聊聊天、用各種 AI 服務畫畫圖之類的,老實說很無感。不過有一個類型倒是一般上班族可能工作時經常會用到的場景,那就是將通話或會議的內容轉錄成文字,並摘錄重點。之前我們介紹過很多款好用的錄音轉文字的軟硬體工具,有的需要買硬體、有的用電腦或手機就能搞定,這次為大家一次整理在一篇文章中,希望能讓大家在日常不論是生活或工作使用都可以有事半功倍的效果!
當前最強免費 / 付費 AI 錄音轉文字軟硬體服務總整理
世上沒有白吃的午餐,所以世上也幾乎沒有真正好用、全面又完全免費的 AI 文字轉錄服務,也因為這樣在這裡我依照「要不要花錢」來做簡單的區分。簡單說花錢的一定最省心省事,軟體硬體都幫你搞定,使用起來舒舒服服的,但就是要花錢買硬體,有的還要付月租費。如果不想花錢的話,在使用上一定多多少少有侷限性,不是要自幹,就是要繞一大圈才能達到與花錢買的硬體服務有接近的結果,至於要不要花錢就看大家自己的選擇。這次介紹沒有 Android 平台,因為都要錢,如果有免費好用的文字轉錄 Android APP,也麻煩告訴我們,立刻補上。
我們也有作影片版內容,歡迎大家看看,按讚、訂閱、開啟小鈴鐺就更好啦:
付費 AI 錄音轉文字軟硬體
Plaud Note
可能是目前最成熟、最好用的「手機端」錄音且可以轉文字的硬體,它可將電話裡面所有電話、LINE、Messenger 錄音下來,並用內建的 OPENAI 服務轉錄成文字並節錄重點,之前在募資平台販售時一堆人私訊問我好不好用,在當時的確是「無敵」的存在,到現在還是非常好用,非常適合整天在外面走跳的商務人士使用。現在已經正式開賣了,現在買沒有之前早鳥每個月都有免費分鐘數的優惠,不過單買時數也不算太貴。
大家可以看之前的文章介紹(請點我),新版本在介面上做了蠻多的優化,之前被我吐槽的不能修改錯字的部分也改進了:
我們也有拍攝影片,想瞭解的朋友可以看 Plaud Note 是怎麼工作的:
優點:精準、好用、跨裝置,所有來電或會議情境錄音都能用。
缺點:要花錢買、有月租費、沒有翻譯與自定義的功能。
Plaud Note這邊買
HiDock H1
如果說 Plaud Note 是外出走跳的業務最需要的伙伴,那 HiDock H1 就絕對是坐辦公室的上班族最強配合神器!它本身就是一組超多功能的 HUB,只要一條線連接筆電或電腦之後,就可以讓筆電外接最多三顆螢幕,而且可以與您的手機藍牙配對,只要有來電就可以透過 HiDock H1 接聽(同時決定是否要錄音),只要電腦端或手機端可以用的任何通話(電話、LINE、TELEGRAM、WeChat….)或會議軟體(Zoom、Teams、Google Meet…)軟體的會議內容全部都錄音起來(你願意的話也可以把它跟筆電一起抱進會議室,直接紀錄實體會議轉錄文字與摘要),並使用內建的 HiNotes 服務將會議或通話內容轉錄成文字並節錄重點,最重要的是基本轉錄摘要功能終身免費:
我們也有拍攝開箱使用影片,有興趣的朋友可以看一下:
優點:可終身免費使用 HiNote 服務,精準、好用,幾乎所有情境都能用,目前我個人覺得的最優解。
缺點:要花錢買硬體,可辨識多國語言,但沒有翻譯功能(要自己搭配 Gemini 使用)。
HiDock H1 預購網址
Magmo Pro
Magmo Pro 可說是 iPhone 錄音硬體「祖師爺」等級的硬體,它當年第一代「Magmo」開創了將設備貼在手機背面就可以進行電話、LINE、MESSENGER通話錄音的創舉,不過第一代功能相對陽春,要聽錄音檔還要接電腦,使用起來不那麼方便。Magmo Pro 則是它的二代產品,除了萬用的錄音功能以外,終於加入了 APP 傳輸功能,聽錄音檔可以傳到手機裡面聽,原本還想加入終身免費的錄音轉錄功能,但沒想到開發失敗(異常難用、準確率超低、時間超短),如果要轉錄文字的話建議使用 BUZZ 或HiNotes 服務轉錄:
優點:便宜、可將電話裡面所有電話、LINE、Messenger 錄音下來,再透過傳輸線或 App 傳到手機電腦中。
缺點:轉文字能力差,建議搭配 BUZZ 或其他應用轉錄文字。
Magmo Pro 這裡買(請點我)
Transcribe AI
「Transcribe AI: Voice to Text」是一款非常好用的 AI 筆記 App,跟一般語音轉文字工具不一樣地方在,它除了有轉錄外,還提供 AI 摘要、Highlight 重點的功能,也就是幫你把整個語音內容統整,這真的很方便,更重要是連翻譯功能都有,你可以錄製英文或其他語言的語音、影片,它會輸入成中文給你。不過由於 iPhone 本身的限制,它只能幫你轉錄錄音檔的文字內容,年訂閱要近 NT$,3000,下載後的前三天免費,偶爾會限免,大家可以鎖定我們粉絲頁,限免時會告知大家:
點我前往 Transcribe AI: Voice to Text 下載頁面
免費 AI 錄音轉文字軟體
接下來講到免費錄音轉文字服務,這些軟體都是開源(但需要自己安裝),或是免費時數給的很大方,由於沒收你錢所以不可能面面俱到,最基本的就是沒有手機通話錄音(有需求還是花錢買錄音卡吧),但可以將平時的錄音轉成文字,然後自己再用 ChatGPT 或 Gemini(推薦,因為免費)去做摘錄的動作。
剪映
很多人都用剪映剪片子,但你不知道的是剪映本身也內建非常強大的文字辨識功能,你只要直接把錄音檔或影片檔丟進去剪映,選擇「文本」再使用辨識字幕功能即可:
辨識完之後在右上的視窗就會有時間軸對應的文字內容,實測對於破音字與名詞比較容易有問題,但準確度80~90%是有的,不過轉出來的內容會是簡體字,而且會傳到雲端進行辨識,在意的就別用:
匯出時記得只要選擇匯出文本,格式選TXT(SRT會有時間前綴,一般人應該不需要),匯出後自己找一個簡轉繁網站將內容轉成繁體字,這樣就有錄音轉文字稿了:
如果需要摘要的話,再丟給 ChatGPT 或 Gemini(免費)去做總結即可,不過整個流程就是有點囉唆:
想瞭解剪映的詳細功能可以看這部影片:
BUZZ
BUZZ 是一款基於 Open AI Whisper 的開源語音辨識軟體,可將影片、手機或錄音筆裡面的錄音檔轉錄為文字,支援多國語言、非常準確、免付費、資料不上傳雲端,但需要自己安裝到電腦中執行,且電腦等級不能太差(會跑得有點痛苦):
使用時只要選擇最大規模的語言模型,辨識正確度我自己覺得超過95%,主要還是名詞之類會比較容易辨識錯誤,轉出來的文字檔一樣自己丟到 Gemini 節錄重點即可,想更詳細瞭解怎麼使用的朋友可以看下面連結的教學:
HiNotes
HiDock公司推出的免費服務,沒買 HiDock H1 的話最高可以免費轉錄 10 分鐘文字,也可以總結錄音內容,不怕麻煩的話自己手動把錄音檔裁多段慢慢轉錄文字也可以,免費版只能在桌機瀏覽器上傳檔案,有買 HiDock H1 的話則是可以把任何錄音檔上傳到 HiNotes 轉錄文字,最長可達單檔四小時:
HiNotes 服務請點我
Sound TYPE AI
可轉錄文字並摘要重點,註冊就每個月就可使用180分鐘(但每段只有8分鐘),理論上可以一直換帳號用下去,有APP可以使用:
Sound TYPE AI服務請點我
結語
以上就是這次分享的錄音轉文字並摘要的所有分享,老話一句「付費的省心、省錢的費心」,看你怎麼選擇,如果要我推的話,一般人目前省事又花費不高的我會推薦買台 HiDock H1,除非有特殊需求,不然目前的終身轉寫摘要服務非常方便,真的需要手機通話功能的話,就買 Magmo 搭 HiNotes 用,或是直接衝 Plaud Note 也是很好的選擇。如果沒這個預算就使用剪映或BUZZ自幹也是可以的,推薦給大家參考。