現在 AI 可說是無所不能,不僅能將圖片轉成音樂,現在連轉音效都沒問題,這篇要推薦的 Image to SFX 就是一款圖片轉 AI 音效免費工具,上傳你的圖片,選擇要用的生成模型後,就能獲得由 AI 生成的音效,我實測效果可說相當不錯,只要圖片的意境很明確,基本上都能獲得適合的 AI 音效,生成速度也蠻快的。
Image to SFX 圖片生成專屬 AI 音效,提供四種音訊生成模型
Image to SFX 是一款建構在 HuggingFace 的圖片轉 AI 音效生成工具,點擊上方連結進到網頁後,它有預設一個鳥在河流中的圖片,你可以直接按 Submit 體驗看看那感覺:
左側可選擇要用的生成模型,共有四種,「MAGNET」、「AudioLDM-2」、「AudioGen」與「Tango」,預設為 AudioLDM-2,這個效果其實就很不錯,但你也可以都試試看,看哪一個生成出來的音效你最滿意:
按 Submit 之後,就會開始生成,下方 processing 右邊會告訴你大概需要花多久時間,基本上應該都一分鐘以內就完成。不過要注意是,如果當下用戶數量太多,有可能生成時間就要更長,它也會跳出提示訊息,有看到的話就建議晚一點再試:
生成好後,底部會出現播放控制介面,按播放即可聆聽,滿意的話右上角有下載圖示,點一下就能將音效下載下來,格式為 .wav:
下面就提供一樣我測試的圖片 AI 音效。
首先是這張在海上拍的照片:
再來是街道的照片:
這個貓咪照片我用 AudioLDM-2 模型出來的效果不是非常好,因此我改用 Tango,這就蠻讚的,非常符合這張照片的意境,有讓我驚艷到:
最後是拳擊賽,我測試四個模型出來的音效都普普,沒有像上一張那麼好,可能是我這照片的顏色太過鮮豔複雜,越單調 AI 應該越能分析是什麼情境:
就目前來說,雖然跟真實音效還有一段差距,某些照片分析出來的 AI 音效不是那麼真實,但整體來說我是覺得已經很猛了,未來如果持續進步、訓練更多聲音,以 AI 進步的速度來看,搞不好不用多久,就能真正的生成出超真實音效。
如果你測試出來的 AI 音效覺得還好,記得用其他模型跑跑看,有些模型會給出更好的結果。
除了這一個,如果你也想試試看圖片生成 AI 音樂,我們之前也有介紹一款 Image to Music,也是免費工具,不過效果沒有這一個這麼好:
另外這個 CLIP Interrogator 還可以幫助你取得生成類似圖片的 Prompt 提示描述: