Beszédfelismerő program: hanganyagból írott szöveg és videofeliratozás, új felületen

Közel egy évvel ezelőtt mutattuk be az egyik, mellesleg azóta is a legjobb AI alapú beszédfelismerő szolgáltatást: a hazai fejlesztésű Alrite lényege, hogy a feltöltött hanganyagokat képes írott, szerkeszthető szöveggé alakítani több nyelven (magyar, angol, német, spanyol), illetve a feltöltött videók hangsávja alapján pontosan időzített feliratokat készít, amelyek aztán letölthetők több formátumban, beleértve a népszerű SRT feliratfájlokat is. Korábbi tesztünk elolvasható erre a linkre kattintva, ám most kiegészítjük azt néhány újkeletű információval, nemrég ugyanis hatalmas változásokon ment át az Alrite beszédfelismerő program, így immár egy modernebb, egyszerűbben használható felületen érhetjük el a szolgáltatás nagyszerű funkcióit: hanganyagból írott szöveg vagy éppen videofeliratozás hangsáv alapján, mindössze pár mozdulattal.

Alrite beszédfelismerő program: hanganyagból írott szöveg, plusz videók feliratozása

Korábbi cikkünk óta szembetűnő változások történtek az Alrite beszédfelismerő szoftveralkalmazásban: először is teljesen új dizájnt kapott, amely amellett, hogy kifejezetten tetszetősre és stílusosra sikeredett, egyben kellően minimalista ahhoz, hogy bárki azonnal kiigazodhasson a szolgáltatás funkciói között. Ráadásul az új felületnél bővült a támogatott böngészők sora is, így a Chrome, Firefox és Edge mellett most már Safariban is működik minden funkció. Maga a felület elérhető angol, német, s természetesen magyar nyelven is (a fejlesztők ígérete szerint érkezik majd a Spanyol nyelvű menü is). A kor követelményeihez alkalmazkodva most már itt is választhatunk világos és sötét üzemmódok között.

A kattintások számának csökkentése érdekében jelentősen átrendezték a funkciókat, a legfőbb feladatokat így minimális görgetéssel elérjük a weboldalon:

  • Diktálás: Ha nincs készen hanganyagunk, semmi gond, diktálhatunk is az Alrite-nak, amely a diktált szövegből aztán rögvest szerkeszthető leiratot hoz létre.
  • Feltöltés: Ha már rendelkezünk hangfelvétellel, egyszerűen feltölthetjük a rendszerbe, s megkezdhetjük a feldolgozását. Ugyanitt tölthetjük fel a videofájlokat is, amelyekhez feliratot szeretnénk készíteni (vagy épp írott, szöveges formában lenne szükségünk a hangjukra).
  • Youtube: Ha egy Youtube videóhoz szeretnénk feliratot készíteni annak hangsávja alapján, csak adjuk meg a linket, a többit pedig bízzuk az Alrite-ra.
  • Élő közvetítés: Bizony, akár élő adásokat is nézhetünk röptében készülő felirattal. Mondjuk ez egyelőre az EuroNews és az M1 híradó esetében érhető el, de kérhetünk árajánlatot arra is, hogy saját rendezvények, konferenciák, médiatartalmak esetében tudjuk használni az Alrite ezen funkcióját.

A fenti funkciók gombjai alatt azonnal elérhetjük a korábban feltöltött anyagainkat is. Ez így sokkal barátságosabb és átláthatóbb elrendezés, mint a korábbi volt. De az összes funkció elérhető az Alrite logó melletti menüből is. Szintén fontos újdonság a korábbi áttekintés óta, hogy immár nem csak magyar és angol, hanem német és spanyol nyelven is használható a beszédfelismerés.

A fontos funkciók tehát azonnal elénk tárulnak, a fiókkal és az előfizetésünkkel kapcsolatos minden információ pedig teljesen elszeparáltan, szintén egy felületen érhető el, ha rákattintunk a felhasználót szimbolizáló kis ikonra a jobb felső sarokban. Itt elvégezhetünk minden beállítást a felületre vonatkozóan, illetve menedzselhetjük előfizetésünket, módosíthatjuk profil adatainkat stb.

Mellette egy kis kosár jelöli a csomagválasztót, ahol immár megújult előfizetői konstrukciók is rendelkezésre állnak, magán és üzleti felhasználók számára egyaránt. Van amúgy ingyenes, úgynevezett Starter csomag is, amely havonta 30 percnyi hanganyag feldolgozását teszi lehetővé. Ha valakinek van már előfizetése, viszont úgy érzi, nem tudja kihasználni azt, a meglévő csomagot bármikor átválthatja erre a Starter változatra is, viszont ez esetben le kell mondania bizonyos funkciókról is. Az ingyenes regisztrációt követően egyébként 1 órát kapunk ingyen, majd minden hónapban 30 percet, de spórolni felesleges, mert ezek a percek nem halmozódnak. Havonta harminc percnyi anyagot dolgozhatunk fel ingyen.

A többféle csomagból mindenki kiválaszthatja a pénztárcájának és elvárásainak legmegfelelőbbet. Akadnak jelentős különbségek közöttük, így például a feliratot a magasabb kategóriájú csomagokban (magánfelhasználókat célzó Plus, illetve üzleti felhasználóknak szóló Premium és Professional) a fájlok teljes hosszáról létrehozza a rendszer, míg az ingyenes Starter csomagban, az alap funkcionalitású, magán felhasználóknak készült Lite, illetve az üzleti felhasználóknak szóló Prime csomagokban csak mintegy próbaként, minden feltöltés első 2 percéből készül el a felirat. Egyébként újdonság a meghívásos ajánlórendszer is, amellyel 1 órás ingyenes időkeretre tehetünk szert, a linken keresztül regisztráló meghívott első sikeres megrendelésekor. Ezt a plusz időkeretet megkapja a meghívó és a meghívott egyaránt.

Hangfelvétel átalakítása írott szöveggé, Youtube videók feliratozása és további extrák

A felület megújításán túl az Alrite kapott néhány további hasznos új funkciót is. Ilyen például, hogy van már 10 másodperces – bármikor megismételhető – mikrofon tesztelési lehetőség, így diktálásnál a felvétel előtt megbizonyosodhatunk arról, hogy a leendő felvétel hangminősége megfelelő lesz-e a beszédfelismeréshez.

Szintén nagyon hasznos extra a vezényszavak használatának lehetősége, mint például a kettőspont beillesztése, új sor beillesztése, új bekezdés beillesztése stb. Ha a diktálás során ilyen kifejezéseket használunk, akkor később a felvétel adatlapján elérhető Vezényszavak cseréje funkcióval azokat a leiratban formázássá alakíthatjuk. A felvétel egyébként akár 3 órás is lehet – az előfizetői csomagunk függvényében persze -, s bármikor megállítható vagy újraindítható. Ha menet közben az internetkapcsolat esetleg megszakadna, az sem jelenthet problémát, mert az addigi felvétel elérhető marad mp3 formátumban, s az online kapcsolat helyreállítása után feltölthető a rendszerbe.

Ha már szóba került a feltöltés, érdemes megjegyezni, hogy akár 1 GB méretű fájl is gond nélkül feltölthető minden csomagtípusban. A rendelkezésre álló időkeret függvényében a magánfelhasználók számára maximum 3 órás lehet a hangfelvétel vagy a videó hossza (ez a korlát korábban 2 óra volt), míg az üzleti csomagokban nincs a fájl hosszára vonatkozó korlátozás. A 3 órás időlimit vonatkozik a linkkel megadott Youtube videókra is, azonban ezeket a rendszer automatikusan konvertálja feldolgozás előtt, így ott az eredeti fájlméret elvileg nem játszik szerepet a dolgokban.

További hasznos újdonság, hogy a fájlok keresésekor a megadott kereső-kifejezéseket nem csak a fájlnevekben, hanem a fel- és leiratokban is keresi a rendszer, beleértve az eredeti és az esetlegesen lefordított szövegeket is, merthogy például egy magyar nyelvű feliratot akár német vagy angol nyelvre is lefordíthatunk az Automatikus fordítás funkciónak köszönhetően. A fordítások egyébként éppúgy szerkeszthetők, mint az eredeti leiratok.

Szintén üdvözlendő a Verziók funkció megjelenése, amellyel kiválasztható, hogy az eredeti, az – elmentett szerkesztések esetében – szerkesztett, vagy – az elvégzett automatikus fordítás esetén – akár a lefordított szövegverziót szeretnénk-e éppen megtekinteni. Videó elindításakor a kiválasztott feliratverzió jelenik meg. Az adatlapról egyébként közvetlenül letölthető a videó (mp4 formátumban), az abból generált hangfájl (mp3 hangformátumban), a leirat (docx dokumentumként), és az időzítésekkel ellátott feliratfájl (srt fájlként). Utóbbiaknál mindig az éppen kiválasztott verziónak megfelelőt tölti le a rendszer, így a fordítások vagy a szerkesztett szövegek is gond nélkül a gépünkre kerülhetnek.

Maga a szerkesztőfelület is megújult amúgy, a Kiemelt szavak mutatása funkció például felismer egyes kulcsszavakat és azokat címkeként, illetve a leiratban kiemelve is jelöli. Emellett a Bizonytalan szavak funkciónak köszönhetően a leiratban az esetleg kétséges pontossággal felismert szavakat bordó színnel kiemeli a program, így gyorsan ellenőrizhetjük azokat.

Idomulva a mai közösségi őrülethez, a fájlok adatlapja immár publikussá tehető, vagyis egy linken keresztül megosztható másokkal. A publikus adatlapon a hangfájl meghallgatható és letölthető, a leirat és a felirat megtekinthető és letölthető, azonban a leirat szövege nem szerkeszthető. A megosztott adatlapon mind az eredeti szöveg, mind az esetlegesen elmentett szerkesztések, illetve az automatikus fordítások is megtekinthetők, letölthetők. Az adatlap bármikor visszaállítható az alapértelmezett privát üzemmódúra, így a dokumentumhoz ismét csak a fiók tulajdonosa férhet hozzá.

Fejlődött a mobil app is: videofelvétel azonnali feliratozása okostelefonon

Mielőtt elfelejtenénk, az Alrite nem csak webes felületről, hanem akár mobilalkalmazással (iOS és Android) is használható. A mobil app fő újítása, hogy immár nem csak hangfájl, hanem videó is rögzíthető vele, amely a felvétel befejeztével visszajátszható, letölthető, illetve megosztható közösségi médián vagy e-mailen keresztül. Emellett természetesen közvetlenül feltölthető az alkalmazásba is, fel- és leiratozásra.

Szintén hasznos újdonság, hogy a mobilalkalmazásban speciális fájlvédelmi funkció állítható be, amellyel az alkalmazás 24 óránként lezárja a fájlok listáját. A fájlok zárolása a telefon ujjlenyomat- / arcfelismerő technológiájával vagy a beállított jelkód megadásával oldható fel.

Felületüket tekintve a mobil papok még a régi stílust követik, de a cég ígérete szerint hamarosan frissül majd az iOS és az Android változat egyaránt, s onnantól okostelefonon is megújult külsővel segítik a munkát.

Összegzésül: hanganyagból írott szöveg, videók feliratozása, automatikus fordítás egy helyen

Mindent egybevetve továbbra is fenntartjuk, hogy eddig még nem találkoztunk ennél jobb beszédfelismerő megoldással. Ha bárkinek szüksége van feliratokra egy videóhoz, vagy épp szeretne egy hangfelvételt szerkeszthető szövegként viszontlátni, erre jelenleg az Alrite a tökéletes választás. Az ingyenes Starter regisztráció sokaknak jól jöhet, s persze arra is kiváló, hogy leteszteljük a hangfelismerés pontosságát (hosszú tesztelési folyamat alapján mi ki merjük jelenteni, hogy lenyűgözően teljesít), de cégek esetében szinte biztos, hogy valamelyik előfizetői csomagba érdemes beruházni. Mint azt a korábbi tesztben is megírtuk, az Alrite szépen feldolgozza a párbeszédeket is, így egy megbeszélés hangfelvételéből is gyorsan feldolgozható leiratot készíthetünk vele.

Ne maradjon le erről sem!