Nemrég az egyik cikkünkben csokorba szedtük a legjobb offline generatív MI eszközöket, amelyekkel online elérés nélkül cseveghetünk, kérhetjük szövegek megírását, fordítását, kódok létrehozását, vagy éppen képek, zenék készítését. Ám a helyzet az, hogy az ilyen összeállításokat mindig lenne mivel bővíteni. Így aztán a minap mutattunk még egy kiváló eszközt az offline chatbotra vágyóknak, ma pedig arra mutatunk egy újabb példát, hogyan oldható meg a képgenerálás saját gépen, internetkapcsolat nélkül. Mai tesztalanyunk ráadásul több rendszeren is használható, így Windows, macOS és Linux esetében egyaránt tökéletes választás lehet a képek létrehozásához,
Stabiliy Matrix: képgenerálás saját gépen, internetkapcsolat nélkül (Windows, macOS, Linux)
A Stability Matrix egy nyílt forráskódú, cross-platform alkalmazás, amelynek segítségével beüzemelhetjük a gépünkön szinte az összes létező Stable Diffusion alapú – vagy ahhoz hasonló – képgeneráló modellt. Vagyis gond nélkül futtathatjuk vele többek között az SD 1.5, SD 2.1, SDXL, SD3 modelleket és azok leszármazottait, illetve egy új alternatív modellt, a Flux.1-et is (a Schnell és Dev verziót egyaránt). Utóbbi már csak azért is öröm, mert ezzel közel DALL-3 minőségű képeket lehet alkotni.
A modelleken kívül elérhető temérdek LoRA, Upscaler, VAE, Controlnet stb. eszköz is, amelyeket rendkívül egyszerűen tudunk beüzemelni és használni. Amit a CivitAI és Huggingface gyűjtőoldalakon megtalálunk, azt jó eséllyel ide is gond nélkül telepíthetjük pár kattintással, közvetlenül a Stability Matrix felületéről, annak Model Browser funkciójával. A legtöbb mindenféle regisztráció nélkül, ingyen letölthető, de akad néhány – például a Flux -, amelyeknél szükség lesz egy ingyenes CivitAI API regisztrációra a modell letöltése végett (utána már nem kell). Alapértelmezésben az NSFW (felnőtt tartalmak stb.) kompozíciók előállítására alkalmas modelleket elrejti a program, de ha ilyenekre lenne szükségünk, egy kattintással beállítható ezek megjelenítése is.
Bár a Stability Matrixnak van saját képgeneráló felülete, amellett választhatunk továbbiak közül is: Stable Diffusion WebUl Forge, Stable Diffusion WebUl, Stable Diffusion Web UI-UX, SwarmUl, SDFX, InvokeAl. De még a rendkívül népszerű ComfyUl moduláris felületét is megtaláljuk benne. Utóbbi amúgy szerephez jut a beépített Inference nevű képgeneráló felület használatakor is.
A programból meghívott képgeneráló felületek indításakor a beépített terminal emulator felületen minden esetlege hibaüzenetet láthatunk, így tudhatjuk, ha valamelyik összetevővel probléma adódott. Ha bármilyen működésbeli gond lenne, a konfiguráló felületen is van lehetőségünk paramétereket megadni a futtatás jellemzőivel kapcsolatban, így megúszhatjuk néhány kattintással a konfigurációs fájlok kézi szerkesztése vagy a parancssori utasítások írása helyett.
Bár a Stability Matrix nem olyan kényelmes és átlátható, mint mondjuk a Macre készült Draw Things vagy DiffusionBee alkalmazások, de az vitathatatlan, hogy a végtelenségig testreszabható benne minden, így teljes az alkotói szabadság. Ha viszont valami elakad, akkor nem biztos, hogy az átlag felhasználó képes kigyomlálni a problémákat (Python verziók eltérései miatti hibák, GPU támogatás hiánya bizonyos modelleknél egy adott platformon stb.). Persze minden hibáról részletes naplót kapunk, de ez sokak számára inkább ijesztő lehet, mintsem segítség.
Összegzésül
A cross-platform megoldások közül kétség kívül a Stability Matrix az egyik legjobb, ha valaki naprakészen szeretne válogatni az elérhető modell- és felület kínálatból. Természetesen nem csak új képek létrehozására használható, hanem meglévő képek átalakítására is, hiszen a megfelelő képgeneráló felületet kiválasztva az InPaint funkciótól a különféle egyéb Controlnet funkciók is a rendekezésünkre állnak. Ugyanígy a képek felbontásának utólagos növelése is megoldható a különféle Upscale funkciók segítségével.
Ha minden rendben működik, akkor még felhasználóbarát is a program, hiszen mind a beépített képgeneráló funkció, mind a választhatók kiváló lehetőséget adnak rá, hogy bárki megtalálja a számára legmegfelelőbb munkafelületet. Gond inkább csak akkor van vele, ha egy modell vagy felület beüzemelése elakad, mert ilyenkor azért igényel némi szakértelmet a hibaüzenetek kibogozása és megoldása.
Ettől függetlenül csak ajánlatni tudjuk mindenkinek, aki a generatív mesterséges intelligenciával szeretne képeket alkotni. Arra viszont érdemes odafigyelni, hogy a nagy választékban akadhatnak olyan modellek is, amelyeket legfeljebb hobbi célra használhatunk hivatalosan (mindegyikhez van részletes leírás, ezeket érdemes elolvasni). Amivel viszont érdemes számolni: a modellek átlagos mérete 4-12 GB között mozog, de vannak ezeknél méretesebbek is, így ha több ilyet is telepítünk, azzal gyorsan ledarálhatjuk a háttértárunk szabad kapacitását. Emellett pedig az offline képgeneráláshoz kellően erős CPU/GPU/NPU konfiguráció szükséges, s persze minél több RAM memóriára is szükség van, ha tényleg szeretnénk komolyabb modellekkel dolgozni, akkor a minimum a 16 GB memória és egy erősebb videóvezérlő.










