近日法國實驗室 Kyutai 推出一個令人驚艷的「Moshi」AI 即時語音聊天機器人,不僅具備情感,其回應速度還可以對標 GPT-4o,甚至比 GPT-4o 還快,而且還支援本地運行,意味著可以裝在設備裡使用,無需透過網路。
法國實驗室推出「Moshi」具備超即時語音回應的 AI 聊天機器人,你現在就能嘗試
Kyutai 推出的全新「Moshi」AI 即時語音聊天機器人,擁有即時、多模態功能,可實現真正動態和互動式的對話,AI 講話的時候是有情感的,也能針對你的要求來模仿不同聲音,甚至是安慰你,傾聽你的聲音。
在發表會中 Kyutai 演示了不少 Moshi 的應用情境,像是單純的回答問題、爬山時需要帶什麼裝備、模仿法國口音來朗誦一首關於巴黎的詩、扮演海盜來敘述海上的冒險故事等等。
演示中可以明顯感受到 Moshi 的回應速度,真的超級快,甚至很多時候話都還沒說完,Moshi 就已經開始回答,看起來像是它能夠直接預測出你的問題是什麼,進而做到超即時回答的效果。
據了解,Moshi 的延遲可在 300 毫秒以下,歸功於可在本地設備運行的優勢。
雖然回應速度很猛,感覺比 GPT-4o 還快,但 Moshi 一直搶話,也使得對話過程不是那麼自然,這我是覺得不如 GPT-4o。而 Moshi 回應的過程也能隨時打斷,要求它回答其他問題。
部分演示內容可以參考下方有中文字幕的影片:
一家法国的 AI 实验室 Kyutai,刚刚发布一个对标 GPT-4o 的开源实时语音多模态模型,能够听、说、看,而且从演示看,也可以随时打断,可以模仿法国口音说英语,可以说悄悄话。效果比 GPT-4o 要差一点,但是已经很接近了。
重要的是:
– 他们的模型训练管道和架构非常简单且具有很大的可扩展性,像… https://t.co/QN6u2vtPtt pic.twitter.com/Bhz3U7GUQS
— 宝玉 (@dotey) July 3, 2024
完整發表會影片:
從各大報導來看,Moshi 對標無疑就是 OpenAI 的 ChatGPT,但我是認為還有一段距離,光是語言這塊就差很多,Mosh 支援的語言很少,中文部分就不行,沒辦法用中文跟他聊天。
未來 Kyutai 會將 Moshi 免費開源,現階段想嘗試的人,可以到他們的 Moshi 測試網頁試試,不過因為是透過網路,回應速度就沒有發表會上演示的這麼快,我測試時,有時候會發生講完 Moshi 沒反應的狀況,需要重複再講一次(記得要用英文)。
輸入你的 E-Mail 就能測試,記得允許取用麥克風權限:
接著即可開始聊天,而介面也很簡單,下方會顯示 Moshi 的回覆內容,不過每次回覆不會跳下一行,會全部擠成一塊,所以還蠻難閱讀的。你講的內容則不會顯示,也沒有暫停或停止按鈕,不想聊時就整個網頁關掉:
至於正式推出時程,目前就還不知道,但既然都有發表會了,應該不會太遠才對。
而未來會不會加入更多語言?這也不清楚,我是覺得有一點難,畢竟要更多語言代表需要更多訓練資料,Kyutai 的團隊只有 8 個人,應該負荷不了。