隨著 AI 技術越來越強大,現在不僅有不少工具可以把靜態圖片動起來,連講話並套用你的錄音、指定文字內容都沒問題,這款 D-ID 就能做到,而且操作超簡單,你不用懂任何技術,只需要把你想要的靜態人物圖片上傳,輸入或上傳想要他講的內容,這樣就完成了,支援非常多語言,其中就包括繁體中文。
D-ID 可讓靜態人物圖片說話,套用你真實錄音或文字稿(支援多國語言)
進到 D-ID 網站之後,首頁有說明影片,有興趣的人可以看一下。點擊右上或左邊的 Create Video 功能:
接著會進到這畫面,Choose a presenter 選擇你要的人物,這服務有提供一些外國人的臉孔,你也可以自行上傳靜態圖片,又或是用右邊的 AI 產生功能(Generate AI presenter):
需要註冊帳號,提供 E-Mail 或 Google、LinkedIn 帳號登入,每個新帳號都有 20 個 Credits 可用:
我用這張 AI 產生的可愛又叛逆阿達圖片。人物確定之後,右邊 Script 欄位內輸入你想要它講話的文字內容,Audio 則是上傳聲音檔:
先來看聲音部分,把你要跟圖片合成的聲音檔上傳後,會讓你試聽,免費版長度最多只能 5 分鐘,檔案不能超過 10MB,沒問題的話就按右上角 GENERATE VIDEO:
接著會跳出這畫面,圖片右下會提醒會使用多少 Credits,5 分鐘就大概 20 個,免費額度都會用完,建議想先試試的人,不要用這麼長,大概 30 秒到 1 分鐘就好,沒問題案 GENERATE:
5 分鐘大約 1~2 分鐘就會完成,完成時你註冊的 E-Mail 會收到通知:
產生好後,按一下影片:
就可以觀看和下載,產生的影片無法修改,免費版會有浮水印:
下圖是成果影片,D-ID 畢竟是國外服務,中文嘴型很多都對不太起來,速度也沒有很精準,這部分還有待加強,不過我測試文字會比較好一點(下面會分享),畢竟聲音檔還需要一道語音轉文字的辨識,多少會有影響:
文字部分有很多語言都支援,包括繁體中文,Taiwanese 這一個就是:
目前繁體中文提供的聲音就只有三個,二個女的跟一個男的,英文就多很多:
把你要說的內容輸入進去:
按左下角可以試聽:
我這段文字只有 22 秒,因此只花了 2 個 Credits:
成果,嘴型部分明顯比聲音檔還要好一些:
對於想要嘴型對更準確的人,就建議使用內建提供的人物,整體上會更加自然。而 20 個 Credits 用完之後,就必須付費購買,或是重新再註冊一個新帳號。