Év elején mutattuk be az Adobe egyik új fejlesztését, az Adobe FireFly modellek családjába tartozó videó generáló szolgáltatást. Ezzel bárki tud professzionális minőségben videókat generálni, már persze ha előfizet a dologra, mert anélkül sajnos maximum két darabbal tudjuk letesztelni ingyen, hogy mire képes. Az Adobe megoldása kifejezetten ígéretesnek tűnik, de nincs egyedül a piacon. Több videókészítő modell is rendelkezésre áll már jó ideje, többek között a Stable Diffusion műhelyéből is. S akad egy, amely több szempontból is különleges, s amelyiknek nemrég jelent meg új verziója: a Wan 2.1. Ezzel a modellel a videók generálása ingyen is megoldható, s hasonlóan az Adobe Firefly-hoz, itt is választhatunk, hogy csak szöveges leírást adunk a dologhoz, vagy egy minta képet is. A végeredmény pedig sokszor döbbenetesen jó!
Wan 2.1: videók generálása ingyen, akár fotók alapján is, döbbenetes kivitelben
A mesterséges intelligencia (MI) által vezérelt videókészítés rohamosan fejlődik. E terület egyik kiemelkedő szereplőjévé lépett elő nemrég a Wan 2.1 videógeneráló modell, amely az Alibaba Cloud fejlesztése. Ez lehetővé teszi a felhasználók számára, hogy szöveges leírásokból és képekből – akár kezdő és befejező kép alapján is – kiváló minőségű videókat generáljanak.
A Wan2.1 generatív képességeiben jelentős előrelépéseket ért el egy sor újítás révén. Ezek közé tartozik az újszerű tér-idő variációs autoenkóder (VAE), a skálázható képzési stratégiák, a nagyméretű adatépítés és az automatizált értékelési metrikák. Ezek az elemek együttesen javítják a modell teljesítményét és sokoldalúságát. A Wan2.1 a modern szövegalkotó technológiák egyik fejlett módszerét, az úgynevezett Flow Matching eljárást alkalmazza. A modell képes több nyelven írt szövegeket is feldolgozni, amit egy T5 nevű rendszer segítségével kódol. Szóval nem feltétlenül kell vele angolul kommunikálni, egy magyar nyelvű leírásból is képes videót készíteni. S ha már szöveg: ez a modell végre használható a videókon belüli szövegek generálására is, elsősorban angol és kínai nyelven.
A végeredmény rendkívül meggyőző, legyen szó valósághű videókról, vagy éppen animációkról egyaránt. A videók generálása ingyen is megoldható, akár a megfelelő online szolgáltatásokon keresztül, akár offline működő kép- és videógeneráló alkalmazásokkal, amelyekhez letölthetjük a Wan 2.1 modellt nyílt forráskódú változatait a Huggingface oldaláról. Itt több verziót is találunk, amelyek lényegesen eltérnek a generálható videók méretét tekintve, illetve a memóriaszükségletük alapján is. A T2V-14B segítségével 480P vagy 720P felbontású videók generálhatók, az I2V-14B-720P kifejezetten a 720P-s felbontásra, az I2V-14B-480P pedig a 480P-s videókra van optimalizálva. A T2V-1.3B pedig arra hivatott, hogy a kevesebb GPU memóriával felvértezett gépeken is generálhassunk 480P-s videókat, ha nem olyan profi kivitelben, mint a 14B változatokkal, de még így is nagyon szuper minőségben. Ez azt jelenti, hogy adott esetben akár offline is készíthet vele videót bárki, kellően erős masina birtokában. Az alábbiakban eláruljuk, hogyan úszhatjuk meg manuális beállítások és egyéb macerás nélkül a videók generálását.
Online videógenerálók ingyen
Kezdjük az egyszerűbb és így kézenfekvőbbnek tűnő megoldással: az online videógenerálókkal. Ezekből mi most kettőt tudunk javasolni a Wan 2.1 használatához. Az egyik a hivatalos oldal, a wan.video címen. Ezen a legegyszerűbb használni a modellt, hiszen nincs semmi teendőnk, csak bejelentkezni az oldalon, majd szorgalmasan gyűjtögetni az ingyenes napi krediteket. Minden nap kapunk egy alap mennyiséget, s ezt kiegészíthetjük, ha az elkészült videókat értékeljük, vagy ha megosztunk általunk generált videókat a közösséggel. Mindkét dolog megoldható pár kattintással a felületen.
Mellesleg a videók létrehozása sem bonyolultabb. Az AI Videos oldalon kreálhatunk videót szöveges leírás alapján a Text2Video felületen, vagy megadhatunk forrás képet az Image2Video felületre átváltva. Ilyenkor nem csak kezdő, de akár kezdő és befejező képet egyaránt is megadhatunk. Ehhez csak kapcsoljuk be a
Start/End Frames opciót. A kép(ek) megadása önmagában is elegendő ahhoz, hogy a Generate Video gombra kattintva a rendszer létrehozzon valamilyen animációt az eredeti képi tartalom alapján, de opcionálisan megadhatunk még hozzá szöveges útmutatást is.
A Text2Video részben is akadnak extra opciók. A szöveges prompt megadása után kiválaszthatjuk a videó képarányát (16:9, 9:16, 1:1, 4:3, 3:4), bekapcsolva hagyhatjuk vagy kikapcsolhatjuk az Inspiration Mode opciót (ilyenkor az AI is besegít a prompt kiegészítésében, hogy jobb végeredményt kapjunk), illetve bekapcsolhatjuk a Sound Effects opciót, aminek köszönhetően a rendszer nem csak egyszerűen egy videót készít, hanem a képi tartalomnak megfelelő hangeffektekkel, vagy akár zenével is ellátja azt. Utóbbi funkció akkor is működik, ha képekből generálunk videót. Egyébként választhatunk modellt is, a 2.1 Plus jobb minőséget produkál, a 2.1 Turbo kicsit gyengébbet, de sokkal gyorsabban hozza létre a videót (és kevesebb kreditbe kerül).
Sajnos a videók jobb alsó sarkába a webes app egy kis animált Wan logót helyez el, ami egyébként nem különösebben zavaró, de némileg azért korlátozza a felhasználási lehetőségeket.
Ha bármiért szükségünk lenne e mellé egy alternatív megoldásra is, akkor ott van még a Huggingface Spaces oldalán elérhető Wan AI felület is, amely azonban szinte folyamatosan túlterhelt, szóval kell hozzá türelem, hogy elkezdje a feladatot, amivel megbízzuk. Ráadásul töredékét tudja csak beállítások tekintetében, mint a Wan.video.
Offline videógenerálás ingyen
Ha valaki vízjeltől mentesen szeretne videókat generálni és nincs kedve még ingyenes kreditek gyűjtéséhez sem, annak jó megoldás lehet az offline videógenerálás is. Ez a fentebb már említett, a Huggingface oldalról letölthető modellekkel megoldható. Ezeket még akár taníthatjuk is, így egyedi videók kreálását is rájuk bízhatjuk. Persze megfelelően erős hardver birtokában, hiszen ez esetben a gépünk erőforrásait használjuk a videók generálására, ami már egy szimpla képgenerálás esetében is zabálja a memóriát és a CPU/GPU időt.
Működésre bírni a legegyszerűbb talán a ComfyUI vagy a Draw Things segítségével lehet. A Draw Things – amelyről anno itt is írtunk – macOS-en rém egyszerűvé teszi a videók generálását az Apple Silicon alapú gépeken. Még egy korábbi, M1 alapú MacBook Pro esetében is gond nélkül létrehozhatók vele videók, igaz, azért ez időbe telik (akár 20-30 percbe is az 5 másodperces, 480P-s videók generálása).
A Draw Things egy ingyenes, MI-alapú kép- és videogeneráló eszköz macOS, iOS és iPadOS rendszerekre. Az alkalmazás Macen lehetővé teszi a felhasználók számára, hogy pár kattintással letöltsék, majd helyben futtassák a Wan 2.1 modellt, kihasználva annak képességeit és egyben biztosítva az adatvédelmet is, hiszen semmilyen információ nem kerül távoli szerverekre. A Draw Things ráadásul teljesen ingyenes és a fejlesztő villámgyorsan építi be az újabbnál újabb funkciókat.
Összegzésül
Mindent egybevetve a Wan 2.1 egy kifejezetten ígéretes új kezdet a videók generálását illetően. Pláne, ha fontos, hogy az animációk és videók generálása ingyen menjen. A létrehozott kompozíciók többsége tényleg látványos és adott esetben élethű, s ha mindezzel ingyen dolgozhatunk, az hatalmas lehetőség az alkotóknak. Vagy inkább újabb sorscsapás? Nos, ezt mindenki döntse el maga, hiszen a generatív mesterséges intelligencia egyszerre halálos ítélet és kiváló lehetőség a kreatív szakmáknak. Ki, hogyan éli meg ezt a dolgot. De az biztos, hogy még csak a fejlődés elején tartunk, s már most is lenyűgöző dolgokat láthatunk.









