Állandó olvasóink számára minden bizonnyal nem mondunk újdonságot, hogy a leggyorsabban töltődő gyűjteményünk jelenleg az AI rovat, s azon belül is a generatív mesterséges intelligenciára épülő képgenerálók és képszerkesztők. Pedig be kell valljuk, amikor az OpenAI ChatGPT-je miatt elindult a MI őrület, még igyekeztünk tartani valamiféle egészséges távolságot attól, hogy elmerüljünk benne. Ám gyorsan be kellett látni, hogy erre a vonatra kénytelen felszállni az ember, ha akar, ha nem. Mára szinte minden képszerkesztő szolgáltatás és alkalmazás kapott egyszerűbb vagy összetettebb GenAI eszközöket (az Adobe Photoshoppal az élen, de nagyon nem egyedül). De emellett természetesen GenAI alapú csevegők is élik világukat, s lassan Dunát lehet rekeszteni a népszerűbb modellekre (GPT, llama, gemma stb.) épülő offline és online használható eszközökkel. A csevegés és a képgenerálás pedig itt-ott össze is ér, így például a ChatGPT-ben vagy a Microsoft Copilotban is kérhetjük az elképzeléseinknek megfelelő rajzok, festmények, fotók létrehozását a leírásunk alapján. S mostantól így van ez a Google csevegőjében is: Google Gemini képgeneráló használata már mindenkinek ingyen elérhető.
Google Gemini képgeneráló használata már mindenkinek ingyen elérhető
A Google az elmúlt időszakban nagyon belejött a Gemininek és leágazásainak fejlesztésébe. Szinte minden Google termékben, beleértve a Gmailt, az online irodai alkalmazásokat, vagy akár a hirdetések készítésére szolgáló eszközt visszaköszön már a generatív mesterséges intelligencia. Emellett pedig ott az önálló életet élő Google Gemini csevegőfelület, amely kedélyesen elbeszélget velünk bármiről, vagy segít a kódolásban, dokumentumok elemzésében, s még megannyi más teendőben.
Mostantól pedig a képgenerálásban is, ugyanis épp úgy, ahogy a ChatGPT-nél mutattuk, itt is készíttethetünk már képet az MI-vel. Különbség azért több is van. Az egyik természetesen a képgenerálás alapjául szolgáló modell, amely a ChatGPT esetében a lenyűgöző teljesítményre képes DALL-E 3, a Geminiben pedig a Google saját Imagen 3 modellje. Emellett a Gemini/Imagen kettős egyelőre csak 1:1 képarányban hajlandó gondolkodni, míg a ChatGPT/DALL-E esetében akár 16:9 vagy épp 9:16 képarányú képeket is kérhetünk. Az is igaz viszont, hogy míg a ChatGPT ingyenes változatában a képgenerálás kimerül napi két darabban, addig a Gemini jelenleg nem korlátoz minket ilyen durván a mennyiséget illetően.
Használni viszont teljesen egyformán lehet a kettőt, vagyis egyszerűen nyitunk egy új csevegést, majd leírjuk, mit szeretnénk látni a képen (természetesen akár magyarul is) és kivárjuk azt a pár másodpercet, amíg a kép elkészül. A végeredmény a Google Gemini esetében is elég meggyőző a minőséget is kidolgozottságot, a kész alkotást pedig 2024×2024 pixeles méretben tölthetjük le. Persze itt is belefuthatunk tartalmi és kivitelezési hibákba, például a fenti képet látható kétfülű kávéscsészébe. De ilyet a többi képgeneráló is összehoz, gyengébb pillanataiban.
Van viszont egy komoly gond is a Google Gemini képgenerálójával: az ingyenes változat nem hajlandó képet készíteni személyekről. Sem egy kutyát sétáltató gazdi, sem egy piacon zöldséget árusító néni nem megy át a szűrőn. Emberek képekre varázslásához egyelőre elő kell fizetnünk a Gemini Advanced szolgáltatásra. Vagy ha ingyen akarjuk megoldani, akkor ott a konkurencia, kezdve a ChatGPT-től a különféle dedikált képgeneráló eszközökig.









