Amikor hangfelvételek leiratozásáról, vagy videókhoz a hangsáv alapján feliratok készítéséről van szó, elsőre nekünk mindig a magyar fejlesztésű Alrite ugrik be, amelyről korábban részletes tesztet is írtunk már. A generatív mesterséges intelligencia modellek terjedésével azonban jócskán akad konkurenciája ennek a remek hazai fejlesztésnek is, s bár mai tesztalanyunk sok szempontból kevesebbet nyújt, mint amire az Alrite képes, arra, hogy egy hangfelvételből szerkeszthető szöveg váljon, tökéletesen megfelelő. Megmutatjuk, hogyan oldható meg egy hangfelvétel leiratozása vagy összefoglalása írásban a Gemini segítségével, pillanatok alatt.
Hangfelvétel leiratozása vagy összefoglalása írásban a Geminivel
A Google Gemini segítségével meglehetősen sok olyan feladatot megoldhatunk immár másodpercek alatt, amelyek korábban profi alkalmazásokat és némi hozzáértést is igényeltek. Ilyen például egy lakás fotójának virtuális berendezése, vagy különféle képszerkesztési feladatok elvégzése. Ehhez ma már nem kell Photoshop sem, csak némi képzelőerő és egy jól megfogalmazott prompt a Gemini nevű AI-csevegőben.
Nemrég a cég egy újabb, nagyon hasznos funkciót integrált a Geminibe, ami nem más, mint a hanganyagok szöveges leiratozása vagy összefoglalása. Hosszasan ezt sem kell bemutatnunk, mert a használata nagyjából ugyanolyan pofonegyszerű, mint a korábban mutatott képszerkesztési funkció volt: egyszerűen töltsük fel a hanganyagot egy új beszélgetésben a Geminibe, majd ékes magyarsággal kérjük meg, hogy foglalj azt össze, vagy épp készítsen belőle teljes leiratot.
Mellesleg, ha már emlegettük a bevezetőben a feliratok készítését, erre is megkérhetjük a Geminit, például a “Készíts ehhez a hanganyaghoz feliratot időzítésekkel az srt formátumnak megfelelően.” utasítással. Ekkor szépen elkészíti az időzítésekkel jelölt szöveget a hanganyagból, amelyet csak át kell másolnunk egy .srt kiterjesztésű szövegfájlba a videónk mellé. Kevésbé kényelmes, mint az Alrite, de ha épp a Gemini van kéznél erre, bizony ebből a szempontból is jól teljesít.
Természetesen nem csak magyar nyelvű hanganyagokkal dolgozhatunk, hanem más nyelveken is, s az is természetes, hogy azért akad a dologban korlátozás is: aki ingyenes Gemini hozzáféréssel rendelkezik csak, az jelenleg maximum 10 perces hanganyagokat dolgozhat fel így. A Pro előfizetőknek ez a limit jóval nagyobb – elvileg akár 3 órás – anyagok feldolgozását is lehetővé teszi. Ha videót töltünk fel, akkor ingyen 5, Pro előfizetéssel egy órás anyagot hajlandó feldolgozni a Gemini jelenleg. Egy időben – egy prompttal – amúgy egyszerre 10 fájlt leiratozhatunk. Mivel ezek a limitek változhatnak, linkeljük a Google hivatalos támogatói oldalát is ezzel kapcsolatban.
A helyzet nem változott nagyon, mi továbbra is csak ajánlani tudjuk leiratozáshoz az Alrite-ot, mert rengeteg extrával kényeztet minket a szimpla leiratozáson túl, de ha valaki gyors leiratozásra vagy egy hangfelvétel szöveges összefoglalójára vágyik, akkor a Gemini is kézenfekvő megoldás lehet immár.







