A számítógép és a mesterséges intelligencia (AI) – vagy legtöbbször a gépi tanulás (ML) – számtalan ponton kényelmesebbé teheti az életünket. Az egyik ezek közül, amikor egy hangfelvételt szeretnénk átalakítani szerkeszthető szöveggé, hogy aztán egyszerű dokumentumként, vagy akár egy videó felirataként hasznosítsuk azt. Ehhez már megmutattuk az egyik legjobb – ráadásul magyar fejlesztésű – megoldást, amely ráadásul magyar, angol, német és spanyol nyelvű hanganyagok feldolgozására egyaránt alkalmas. Pillanatok alatt készíthetünk vele leiratot vagy épp feliratfájlt bármilyen hangfelvételből. De mi van akkor, ha épp az ellenkező irányban gondolkodunk, s egy kész szövegből, dokumentumból szeretnénk hangos változatot létrehozni, lehetőleg anélkül, hogy nekünk kelljen felolvasni? Nos, a számítógép és a mesterséges intelligencia (AI) ilyenkor is segíthet. Íme egy online szolgáltatás, amellyel megoldható az írott szöveg hanggá alakítása több nyelven, AI segítséggel.
TexTalky: írott szöveg hanggá alakítása élethű emberi beszédként, több nyelven, AI segítséggel
Az úgynevezett text-to-speech megoldások meglehetősen régóta velünk vannak, sőt, mára a Windows és a macOS, illetve a különféle mobil rendszerek alapból is tartalmaznak ilyeneket. Jól jöhetnek, a látási nehézségekkel küzdőknek a weboldalak tartalmának, a rendszer menüpontjainak, dokumentumoknak stb. a felolvasásakor. Nem tökéletesek, de a célnak általában megfelelnek. Arra is viszont javarészt alkalmatlanok, hogy mondjuk rájuk bízzuk egy bemutató, egy novella vagy más irományok felolvasását, hogy aztán ebből olyan hangfájl készüljön, amelyet meghallgatni sem kínszenvedés senkinek.
Nos, a TexTalky nevű online szolgáltatás épp azt ígéri, hogy élethű emberi beszéddé képes konvertálni az írott szövegeket, ráadásul nem is egy, hanem több mind 130 nyelven, azokon belül pedig különféle nyelvjárásokban és hangtípusokban (különféle férfi és női hangok). Mindezt szinte másodpercek alatt.
Szükségünk lenne egy narrációra a készülő e-learning anyaghoz, videóhoz, prezentációhoz? Ráadásul több nyelven? Nem gond! Egyszerűen bemásoljuk a TexTalky felületén a szöveget a megfelelő helyre, kiválasztjuk a nyelvet, a hangtípust, s már készülhet is a hanganyag a szövegnek megfelelően. Ha elégedettek vagyunk vele, elkészíthetjük és letölthetjük a végleges hangfájlt WAV, MP3, OGG vagy WEBM formátumokban.
Ráadásul ha nem teljesen olyan a hangsúlyozás, sebesség stb., mint ahogy azt elképzeltük, a program arra is ad lehetőséget, hogy jelzések elhelyezésével segítsünk a gépnek áthidalni ezeket a kihívásokat. Az SSML jelölések használatával remekül finomíthatjuk a gépi beszédet. Így a végeredmény tényleg nagyon jó minőségű lehet, sokszor nem is lehet megkülönböztetni, hogy valódi ember beszél, vagy csak a gép által generált hangot hallunk.
A Textalky a világ négy legnagyobb informatikai vállalata által biztosított WaveNet technológiát használja, amely ahelyett, hogy szótagokat fűzne egymás mellé, összetett szabályok alapján határozza meg, hogyan kell az egyes hanghullámokat kialakítani. Így a végeredmény meglepően hasonló az emberi beszédhez.
Maga a felület nagyon jól átgondolt, egyszerűen használható és gyors. A nyelvek között ott szerepel a magyar is, amelynek AI változatai kifejezetten jól teljesítenek. Nem állítjuk, hogy érdemesebb lenne így összerakni egy hangoskönyvet, mint megbízni egy színészt azzal, hogy felolvassa, viszont marketing anyagok, rövidebb útmutatók, call-center szövegek, egyszerűbb narrációk létrehozásához abszolút megfelelő választás lehet. Kiváltképp ha több nyelven kell prezentálnunk mondjuk egy narrációt, s épp nem tudunk leakasztani a szekrényből senkit, aki beszéli az érintett nyelveket.
A TexTalky sajnos nem ingyenes, viszont tudásához mérten meglepően olcsó. Vagy lifetime előfizetéssel használhatjuk (ez havi 50 000 karaktert jelent, illetve első alkalommal 1 milliót), vagy pre-paid rendszerben vehetünk adott karakterszámú csomagokat. Ráadásul nem kell zsákbamacskát venni, mivel van lehetőség ingyenes kipróbálásra is (bár jól meg kell gondolni a tesztmondatokat, mert csak pár ezer karaktert kapunk hozzá ingyen, ha regisztrálunk). Ha valakinek szüksége van arra, hogy az írott szöveges dokumentumokat hangfájlként tálalhasson, érdemes megismerkednie ezzel a szolgáltatással.







