Ha igazán őszinték akarunk lenni, akkor be kell vallanunk, mindig megdobogtatja a szívünket, amikor hazai fejlesztésekről írhatunk. Szerepelt már nálunk a Forklift, a Craft, az InCash, de az egyik nagy kedvencünk kétség kívül az Alrite. Ez – nagyon leegyszerűsítve – egy webes és mobil felületen használható leiratozó- és feliratozó app, amely hangfelvételekből vagy videók hangsávjából egyaránt tud dolgozni, s a leiratokat vagy feliratokat akár több nyelven is tudja prezentálni (legutóbb itt volt róla részletes tesztünk). Magyar nyelven régóta a legjobb teljesítményt hozza, még most is, hogy azért a különféle generatív AI megoldásokkal (például OpenAI Whisper) elég erős konkurenciát kaptak. Ám az Alrite még mindig jobb választás, ugyanis a már meglévő funkciók mellé a cég folyamatosan integrál újabbakat. Az idei évet például azzal kezdték, hogy mostantól megoldható a beszélgetők hang alapján történő azonosítása leiratozáskor, méghozzá teljesen automatikusan. Lássuk, miként működik ez az Alrite újdonság.
Alrite újdonság: beszélgetők hang alapján történő azonosítása leiratozáskor
Arra amúgy már eddig is képes volt az Alrite, hogy amikor egy hangfájlból vagy hangsávból szöveges átiratot készítettünk, automatikusan beazonosítsa, hogy kettő vagy akár több személy vesz részt egy párbeszédben, s ilyenkor a leiratban jelezte is, hogy melyik mondat tartozik az adott személyhez. Persze elnevezni nem tudta őket, hiszen gőze sem volt arról, kiket hall. Utólag ugyan villámgyorsan elnevezhettük a szövegben a beszélgetőket (és ha az egyik mondatnál ezt megtettük, a többire automatikusan ráhúzhattuk), de azért ez mégiscsak igényelt némi odafigyelést, legalább annyit, hogy mi magunk beazonosítsuk az első mondatot egy-egy adott személytől. No, erre mostantól, bár lehetőség továbbra is lesz, de szükség nem feltétlenül.
Az Alrite ugyanis bővült egy Hangprofilok funkcióval, amely ugyan jelenleg még béta állapotú, de az üzleti előfizetők számára már használható és a tesztjeink alapján – ha betartunk egyetlen szabályt – gyönyörűen működik. Használható az Alrite felületen közvetlenül rögzített felvételeken éppúgy, mint a feltöltött hangfájlokon és egyéb forrásokon, amelyeket eddig is használhattunk a programban. A folyamat is ugyanaz marad hosszú távon, merthogy az elnevezések teljesen automatikusak, szóval beavatkoznunk egyetlen egyszer kell: a hangminták rögzítésekor.
A dolog így működik: a beszélgetőktől rögzítünk egy-egy hangmintát, a program ezt eltárolja, majd a legközelebbi hangfeldolgozás során már ennek alapján igyekszik beazonosítani, hogy a felvételen hallható-e olyan személy, akitől van hangmintája. Ha igen, már nem csak egyszerűen a Személy 1, Személy 2 stb. elnevezéseket biggyeszti oda a leiratba, hanem a beszélő nevét is (vagy amit azonosítóként meghatároztunk nála).
Hangminták rögzítése az Alrite-ban
A hangminták rögzítése rendkívül egyszerű. Ha van egy felvételünk, nyissuk meg a szerkesztőfelületen, majd elsőként – ezúttal még manuálisan – nevezzük el benne a beszélgetőket. Ez pár kattintás csupán, hiszen a program automatikusan számozza azokat, csak ezt a számozott azonosítót kell lecserélnünk egy-egy névre.
Ezután a bal oldali eszköztárban kattintsunk a Hangprofilok gombra. Itt kiválaszthatjuk a beszélőket, s a mellettük lévő + jelre kattintva létrehozhatjuk a hozzájuk tartozó hangprofilt. Ehhez a program listába szedi a beszélgetőhöz kapcsolódó mondatokat, nekünk csak annyi a teendőnk, hogy bejelöljük amiről úgy gondoljuk, egyértelműen jellemző az illetőre (és amiben lehetőleg nem vág más a szavába), majd mentsük a profilt. Ha nem akarunk válogatni, egy kattintással bejelölhető az összes mondat. Persze nevet még adjunk a hangprofilnak – és a felismerendő személynek is -, lehetőleg olyat, amiről később tudni fogjuk, kiről van szó. Ugyanezt a folyamatot el kell játszani minden beszélgetőpartnerrel. Egyszer.
Amennyiben ezt megtettük, onnantól már a program teljesen automatikusan dolgozik ezekből a hangmintákból, így a legközelebbi leiratozásnál semmi dolgunk nem lesz, ugyanis automatikusan elnevezi a beszélgetőket a szövegben. Ha mégsem, akkor a hangminta valószínűleg nem sikerült jól: gyenge a hangminőség, vagy egyszerűen kevés a hangmennyiség a biztos beazonosításhoz. Ilyenkor érdemes még hozzáadni újabb mondatokat, amit egyszerűen megtehetünk ha olyan beszélgetéseket nyitunk meg, amelyeken az illető részt vett és a Hangprofil felületen a + jelre kattintva hozzáadunk újabb mondatokat a profiljához. Tesztjeink alapján személyenként jó 1,5-2 percnyi beszéd tárolásával már üzembiztos a program felismerő képessége.
GDPR szempontból persze a hangprofilok tárolásának biztonsága is kiemelt fontosságú, így az Alrite-ban arra is van lehetőség, hogy ha már nem kellenek, vagy valaki kifejezetten ezt kéri, akkor törölhessük a feleslegesség vált mintát. Ezt a Fájlok menüpontban tehetjük meg, ahol eddig is visszanézhetők voltak a le- vagy feliratozott anyagok, de most felül már a hangprofilokat is láthatjuk és szerkeszthetjük vagy törölhetjük bármelyiket. Értelemszerűen ha a törlés mellett döntünk, onnantól a funkció a törölt személy esetében nem működik majd. Őt manuálisan kell beazonosítani.
Hol tudjuk ezt hasznosítani?
Mindenhol. Tulajdonképpen ahol eddig leiratokat kellett készíteni több szereplős eseményekről, ott ez az új funkció aranyat ér. S bár – mint fentebb említettük – a beszélgetők névtelen beazonosítása eddig is ment a programnak, így, hogy már konkrétan elnevezi a résztvevőket, ez maga a kényeztetés.
Interjúk és beszélgetős podcastok készítésekor, megbeszélések leiratozásakor, előadások felvételekor, zoom és egyéb videós csevegések rögzítésekor, filmekről, videókról készülő leiratoknál, de akár egy ügyfélszolgálati beszélgetésnél is óriási előny és jelentősen gyorsíthatja a hangfelvétel feldolgozását, a leiratok, vagy akár összegzések készítését.
Összegzésül: egyre jobb
A generatív mesterséges intelligencia villámgyors térnyerése minden bizonnyal feladja a leckét a korábban is már gépi tanulásra és MI funkciókra építő szolgáltatásoknak. De úgy tűnik, az Alrite fejlesztői felvették a kesztyűt és a program még mindig mérföldekkel jobb a leiratok és feliratok készítésére, mint az általános célú AI eszközök (lásd korábbi tesztünket is). Nem beszélve a megbízhatóságról és adatvédelemről, ami céges felhasználás esetén végképp nem elhanyagolható nézőpont, amivel azért egyelőre a ChatGPT és társai nem igazán dicsekedhetnek.
Szóval akinek komolyan szüksége van leiratozási és feliratozási eszköztárra és szeretné azt egy célzottan e feladatokra készült felületen használni, annak jelenleg is az Alrite a legjobb választás. Mellesleg már régóta nem csak magyar nyelven.











