看來,Google 不只是想要追上 OpenAI 在自然語音方面的創意,甚至可能想要超越多數人的想像,讓語音功能成為體驗的中心點?繼續閱讀據報 Gemini Live 將支援檔案處理功能,意外揭露語音體驗將成 Google 核心體驗的未來方向?報導內文。
▲本篇圖片來源:Google
據報 Gemini Live 將支援檔案處理功能,意外揭露語音體驗將成 Google 核心體驗的未來方向?
支援類似 ChatGPT 4o 開始的進階對話能耐,可自由打斷插話改變話題等更自然的語音使用體驗的 Gemini Live 生成式 AI 語音功能,日前也已經全面向所有 Android 使用者開放,甚至也已經在部分國家地區啟動了 iOS 版本的應用推送。
現在看來,Google 不只是想要追上 OpenAI 在自然語音方面的創意,甚至可能想要超越多數人的想像,讓語音功能成為體驗的中心點?
最近外媒透過挖掘 APK 的方式,找到了一個 Google app 中關於 Gemini Live 未來可能的功能支援方向。
基本上從程式碼以及應用中的文字描述可以看出。當你在 Gemini 介面中上傳完檔案後,系統未來可能將會導引你開啟 Gemini Live 來進行檔案的處理。
其中提到包括「Open Live」、「Open Live with attachment」與「Talk about attachment」等字眼。
老實講,能上傳或加入 Google Drive 檔案來分析的功能,對於 Gemini Advanced 的訂閱使用者而言,早已不是什麼新鮮的體驗。不過會提示轉而使用 Gemini Live 倒是一個相當新鮮的「處理方式」。
這也讓人猜測,Google 也許認為自己可以從語音功能開始延伸出另外一條新的發展路線 – 或者是,想要在創新體驗方面反擊其他生成式 AI 的競爭對手的積極進攻。
講起來,相對於透過像是 AI Overviews 這樣的新功能來鞏固自己在搜尋引擎上的霸權。進而去防止所有正在猛攻生成式 AI 搜尋功能的品牌,跑來蠶食鯨吞 Google 搜尋的一杯羹。透過積極著眼尋找「Googling」的新時代意義,也許才是擺脫泥沼的良策。
以這樣的角度來思考的話,就會覺得這樣的方向與今年 Google I/O 針對「Google will do the Googling for you」之後的「Just Ask」的標語精神似乎相當接近。
是說由於這個功能還暫時無法試用,所以我們還無法知道,透過 Gemini Live 進行進階的檔案處理將會有什麼樣不同的體驗 – 個人會猜測,這可能只是 Gemini Live 未來新體驗的其中一項而已。
事實上,如果是以先前 Gemini Advanced 的體驗來說,如果遇到需要修改檔案等指令的時候,顯然還是會需要轉而使用傳統的使用介面。
而單就這點,個人就會覺得,搞不好這意味著未來 Gemini Live 將會有把語音與視覺介面結合的 AI 進階互動體驗出現?
當然,這一切只是瞎猜妄想。實際上 Google 會如何透過 Gemini Live 來與其他對手競爭帶來新功能,真的是要等官方的進一步公布才能知道。不過個人是真的相當期待就是了。
畢竟還沒等到 Google AI Overviews 體驗正式來到台灣前,像是 Felo Search 這樣的優秀 AI 搜尋引擎便已經積極的佔據了小編我「Googling」的使用次數。面對這些新創的強勁對手,非常快速的對應 Google 搜尋的體驗增進。
確實 Google 將會非常需要拿出一些新創意,才有可能維持自己的霸主地位啊。
引用來源:Android Authority|經由:Android Central