近期對 Google 來說,Gemini 絕對是投入大量開發資源的重點,陸續加入的眾多 AI 強化功能使原有服務變得更實用同時也更有趣。在 Google I/O 2024 中還宣布,未來幾個月,Google 相簿將獲得上下文感知的語音和文字指令功能「Ask Photo」,用以搜尋特定影像和影像中的細節。
Google 相簿新功能「Ask Photo」將可讓你透過語音和文字指令搜尋影像
Ask Photo 是 Google I/O 2024 上發表的系列用以強化現有服務的新 AI 功能之一。透過 Ask Photo 可以幫助用戶篩選整個 Google 相簿,能夠從中理解獨特識別資訊,並利用它獲得你想要或需要的確切影像。這項新功能超越了常態影像搜尋,Gemini 能夠偵測影像內容,Google 以一張汽車牌照並下了詢問特定車型的特定車牌號碼指令,接著相簿能夠識別並給出你要的答案。
Ask Photos, a new feature coming to @GooglePhotos, makes it easier to search across your photos and videos with the help of Gemini models. It goes beyond simple search to understand context and answer more complex questions. #GoogleIO pic.twitter.com/OsYXZLo5S1
— Google (@Google) May 14, 2024
而另一個例子中,Gemini 能夠根據使用者 Google 相簿中已有的影像來確定孩子在什麼時候學習游泳。雖然自動識別與篩選能力很是吸引人,但像這樣的特定識別指令可能取決於你備份哪些內容類型在 Google 相簿中。在輸入提示或指令時,另外加上上傳時間、位置等其他輔助指令將可用於加快辨識的流程。雖然你也可以對影片使用 Ask Photo,但 Google 並沒有現場展示。
Ask Photo 功能目前官方暫定的正式推出時間是今年夏季,保守估計將在未來幾個月內才會開始推出。而這項功能到底是否需要網路連線才能運作,或是否能在裝置本機上使用,這些細節 Google 並沒有進一步分享。