最近文字生成圖片的賽道可以說是競爭激烈, Stable Diffusion、DALL-E 3 等等的文字生成圖片工具可說是越來越多,近日由 Stable Diffusion 初代創作者建立的新創公司 Black Forest Labs 推出新的文字生成圖片模型 FLUX.1。現在就可以體驗 FLUX.1 這款新的文字生成圖片模型,一起來看看吧。除了教學以外我們還對 FLUX.1 與 DALL-E 3 進行比對,使用一樣的咒語看看到底誰的表現更好。
Stable Diffusion 前創始人開發的文字生成圖片模型 FLUX.1,測試、比較分享
由 Stable Diffusion 原作者之一 Robin Rombach 帶領團隊出來開設的新創公司 Black Forest Labs 近日推出全新的文字生成圖片模型 FLUX.1。FLUX.1 有三個版本, API 閉源的 FLUX.1 [pro]、非商業用途且開放權重的 FLUX.1 [dev]、Apache 2.0 許可的高階版 FLUX.1 [schnell](後兩者可下載到自己的電腦部署安裝使用),今天我們主要使用能在線上免費使用的 FLUX.1 [schnell] 來進行測試。
要使用 Black Forest Labs 最新推出的文字生成圖片模型,大家可以直接點擊下方連結前往使用 FLUX.1 [schnell],或者前往 FLUX.1 官方網站選擇要使用 pro、dev、schnell 哪個版本。
前往使用FLUX.1 [schnell]
前往 FLUX.1 [schnell] 頁面之後就可以開始使用 FLUX.1,大家可以在框框中輸入咒語讓 FLUX.1 生成圖片,輸入完咒語之後可以調整像是圖片比例、生成圖片張數、生成圖片格式等等的選項,建議大家第一次可以輸入咒語後直接讓 FLUX.1 生成圖片,看看效果如何後再做調整。(如果不知道要使用什麼咒語的話可以參考 5 個收集大量 Prompt 的網站的介紹。)
這邊小編使用 Facebook DALL-E 3 prompt tricks 公開社團的咒語,看看使用同一個咒語之下 FLUX.1 和 DALL-E 3 的表現如何。(左邊為 FLUX.1 、右邊為 DALL-E 3)
咒語「A hyper-realistic, magical artwork depicting a romantic scene of a couple emerging from a cup of coffee. The couple, made of swirling coffee and cream, embraces tenderly, their forms elegantly interwoven with steam and liquid patterns. The scene is illuminated by a soft, warm light, highlighting the textures and colors of the coffee and cream. Coffee beans are scattered around the base of the cup, adding to the rich, aromatic atmosphere. The background is dark and moody, enhancing the ethereal glow around the couple, creating an intimate, fairy-tale ambiance.」
咒語「Create a photorealistic hyperdetailed three-dimensional poly resin sculpture of Albert Einstein lying in a beach chair. He is wearing a Hawaiian shirt, sunglasses, and sipping a tropical drink. He is reading a copy of Mad Magazine.」
咒語「A [creature] with a leather jacket riding on a motorbike with the forest whirling past in the background. The motorbike resembles the [creature], with detailed features like its scales, fur, or wings integrated into the bike’s design. The scene is dynamic and full of motion, capturing the thrill and speed of the ride, with trees and foliage blurring into streaks of green and brown.」
咒語「An elegant woman with long, flowing blonde hair, clad in intricate silver armor, rides confidently through an enchanting autumn forest on a majestic white unicorn. The unicorn is adorned with ornate golden accessories that match the woman’s regal attire. Sunlight filters through the canopy of leaves, creating a warm, dappled light effect on the forest floor. The scene exudes a sense of mysticism and bravery, capturing the essence of a mythical journey」
咒語「Art Nouveau illustration of a [CHARACTER] walking with a [ANIMAL] in a [FLOWER] field under a blue sky, vivid colors, [COLOR] and [COLOR] color palette, wearing a [COLOR] robe, detailed floral patterns, ethereal, dreamy atmosphere, highly detailed, by Alphonse Mucha, acrylic painting.」
除了小編自己生成的圖片以外,大家也可以看看 X 上的大神生成的圖片,
Holy shit. Without a doubt the most realistic AI images I’ve ever seen.
We are 99.7% of the way to completely indistinguishable-from-reality AI imagery.
(You can still see a few flaws when zooming in)
This is made with FLUX. Uncanny Valley. pic.twitter.com/5BIRmZey8B
— Roberto Nickson (@rpnickson) August 8, 2024
These are AI photos made with FLUX.1 pro
“boring snapchat photo circa 2015” pic.twitter.com/fqIX5CwZ2o
— Pietro Schirano (@skirano) August 2, 2024
More tests with FLUX.1
It does an excellent job of creating hyperrealistic images. pic.twitter.com/VdTorsJ2Ah
— Halim Alrasihi (@HalimAlrasihi) August 3, 2024
不知道大家看完同一個咒語之下 FLUX.1 和 DALL-E 3 的表現和大神使用 FLUX.1 生成的圖片之後覺得如何呢?其實 FLUX.1 跟其他 AI 文字生成圖片一樣都有手部處理不好的問題,譬如生成愛因斯坦那張圖片時, FLUX.1 多生成出了一隻拿果汁的手。不過相較於其他文字生成圖片工具來說 FLUX.1 呈現的效果算是相當不錯,有興趣的朋友可以點擊下方連結前往體驗 FLUX.1 文字生成圖片的效果。