在稍早的 Google I/O 2024 活動中,不意外的 Google 帶來一系列新 AI 功能,像是 Google 相簿新功能「Ask Photo」、Gemini 將導入 Gamil 和其他 Google Worspace 生產力工具等,而前幾個月才剛推出的 Gemini 1.5 Pro 最新模型,這次也獲得更新,能力變得更強,同時 Google 也預告新一代 Gemma 2 即將於下個月亮相,以及釋出自家首個開源視覺語言模型 PaliGemma。
Gemini 1.5 Pro 現在又變更強了!Google 再推新開源語言模型,Gemma 2 即將亮相
還記得 Google 於今年 2 月推出 Gemini 15 Pro 後,當時可說被不少人認為有機會超越 OpenAI 的 GPT-4 模型,只可惜隨後被爆出影片造假風波,其能力沒有想像中那麼強。
而這次運氣也不是很好,OpenAI 突然搶先於昨日推出全新 GPT-4o 模型,使得 Gemini 1.5 Pro 這次升級感覺就遜色許多,不過效能依舊跟過去相比提升不小。
Google 表示,相較於舊版本,全新升級的 Gemini 5 Pro 在翻譯、寫程式、推理等能力的品質都獲得改進,能處理更廣泛、複雜的任務,從今天起用戶應該會感覺到差異。
同時也加入一個比較小的 Gemini 模型:Gemini 1.5 Flash,這模型特別針對較窄或高頻的任務進行優化,跟 Pro 相比,回應時間速度快非常多。目前這二個模型已經在 200 多個國家和地區提供預覽版,預計在 6 月份推出正式版。
而這幾個非常受歡迎的 Google 開源模型 Gemma AI,Google 也宣布推出二個全新模型,一個是首個視覺語言開源模型「PaliGemma」,特別針對圖像標題、視覺回答、以及其他圖像任務優化。
另一個是下一代 Gemma 模型:「Gemma 2」,這是一個擁有 270 億參數的超大模型,模型名稱會叫 Gemma 27B,專為開發人員和研究人員開發,可提供行業領先的效能,還標榜效能比超越一些比它大二倍的模型,而且可以在有效的在 GPU 或 Vertex AI 單一 TPU 主機上運行。
Gemma 2 要等到下個月才會登場,PaliGemma 則現在就能用:
相較於 OpenAI,這次 Google 沒有特別演示這幾個新模型的處理能力,稍微有點可惜,看起來這次比較大的重點是能在本地運行的 Gemini Nano。
如果你對 Google I/O 2024 有興趣,Google 有特別剪輯 10 分鐘簡短影片,幫助你快速了解活動最重要的內容:
針對 Gemini API 開發者也有一些更新,加入兩個新 API 功能:「video frame extraction 」和「parallel function calling,」,以及除了在符合條件的地區透過 Google AI Studio 可免費使用 Gemini API 之外,新的按使用量計費服務也提升了速率限制。