相信很多人在使用 AI 圖片生成功能時,應該都會樂見系統能直接提供修圖,或者是追加指令的工具。想必能讓體驗變得更簡單。現在看來,Google 似乎打算透過他們目前的招牌生成式 AI 服務 Gemini 實現這樣的使用方式。繼續閱讀證據顯示 Gemini AI 圖片生成將支援接續編修功能報導內文。
▲圖片來源:Android Authority
證據顯示 Gemini AI 圖片生成將支援接續編修功能
雖然對於支援圖片生成的生成式 AI 模型而言,所謂的「修圖」的概念,第一直覺能夠實現的方式,可能就是把圖片傳給 AI 分析,然後再進行相關的生成。或者是微幅改變指令一次次從頭生成圖片 – 這可能就得學會靠「咒語」將結果控制在相當程度的範圍內的 Prompt 技巧。
▲圖片來源:Google
因此,相信很多人在使用 AI 圖片生成功能時,應該都會樂見系統能直接提供修圖,或者是追加指令的工具。想必能讓體驗變得更簡單。
現在看來,Google 似乎打算透過他們目前的招牌生成式 AI 服務 Gemini 實現這樣的使用方式 – 甚至還能讓你採取類似目前 Android 所提供更直覺搜尋功能,以「畫圈」的方式指哪修正哪,簡單完成指定的修圖指令!
▲圖片來源:Android Authority
外媒 Android Authority 透過挖掘 v15.29.34.29 beta 版本的 Google app for Android。發現在 Gemini AI 生成圖片的功能介面中,出現了可以分別針對單一圖片「再」進行 Prompt 指令的對話框介面。
簡言之,就是你可以選擇生成出來的圖片中最好的那張,然後再予以修正加強細節。而這項功能最妙的是,它還可以允許使用者用手指/繪圖筆來圈選圖片之中的範圍。「疑似」讓使用者可以針對這個區域再進行指定範圍的修圖 – 也就是不用再用文字形容位置或特徵,直接用畫的就可以了。
是說,前面會用疑似來形容這項功能,相信大家也猜到,這項功能目前基本上是還無法正常運作的。
外媒判斷這個功能雖然已經被挖到,但實際上後端的功能要被啟用,可能還需要 Google 從伺服器端提供服務才能獲得。不過即便如此,接下來 Gemini 圖片生成功能的進步方向還是非常值得關注!
因為它也許不只是能畫圈而已?如果也能支援箭頭?或者是直接畫一個形狀或者是直接給 AI 參考的角度方向等資訊來進行圖片生成?那是不是就更有意思了呢!
如果真的可以在文字以外,支援這麼有變化的指示方式的話,個人覺得 Gemini AI 的靈活度以及實用度應該將會大大升級!另一方面,可以持續縮小範圍而不用一直從頭開始生成,可能也能減輕伺服器的負擔?
引用來源:Android Authority|
延伸閱讀:
據報 Apple Intelligence 將錯失 iPhone 16 跟 iOS 18 首發機會,至少需等 iOS 18.1 才會正式推出(編輯觀點)