Mesterséges intelligencia. Valószínűleg nincs olyan nap, amikor ne esne be ezzel kapcsolatban egy újabb hír az RSS gyűjtőbe vagy az Inboxba. Naponta érkeznek az új szolgáltatások, szoftverek, amelyek többsége persze azonos AI-motorra épül, de funkciók és felépítés tekintetében ennek ellenére is hatalmas közöttük a szórás. Nálunk is egyre több ilyen került terítékre, de igyekszünk persze elválasztani az ocsútól a búzát: mutattunk már remek képgenerálót, chatbotot, keresőt, amelyek mind-mind a mesterséges intelligenciát használják feladatuk elvégzéséhez. Sőt, olyan – ráadásul magyar fejlesztésű – beszédfelismerővel is szolgáltunk már, amelyik minden rendszeren használható és professzionális minőségben képes videókat feliratozni vagy hangfelvételeket leiratozni. Teszi ezt webes felületen, vagy épp okostelefonos appként. Ma szintén a hangfelvétel szöveggé alakítása lesz a téma, de ezúttal egy maces alkalmazást mutatunk erre a célra: ez a MacWhisper Pro amelynek ingyenes változata is van.
MacWhisper Pro: hangfelvétel szöveggé alakítása, OpenAI Whisper alapokon
Ha egy videóhoz szeretnénk utólag feliratot varázsolni a hangsáv alapján, vagy egy értekezleten készült hangfelvételt szeretnénk leiratozni, a MacWhisper bármely feladatra jó választás lehet. A program macOS alatt használható (inteles és Apple Silicon alapú gépeken egyaránt), s van belőle egy teljesen ingyenes változat, illetve egy Pro verzió is, amelyet jelen pillanatban 12 eurós áron lehet megvásárolni a készítő Gumroad oldalán.
Ha valaki folyamatosan nyomon követ minket, egészen biztosan belebotlott az elmúlt hónapokban az OpenAI-féle ChatGPT chatbot tesztjébe, illetve a szintén az OpenAI mesterséges intelligencia megoldásain alapuló DALL-E 2 nevű képkészítőbe. Nos, a MacWhisper akár ezek rokonának is tekinthető, merthogy az OpenAI Whisper nevű átírási technológiáján alapul. Vagy a hangfelvételt ebben az esetben a mesterséges intelligencia dolgozza fel és alakítja írott, szerkeszthető szöveggé.
Ennek megfelelően ahhoz, hogy a folyamat működhessen, a programnak szüksége van az úgynevezett Whisper modellekre, olyan adatbázisokra, amelyek az egész szövegfelismerés alapját képezik. Az ingyenes és a fizetős verzió között pedig az a leglényegesebb különbség, hogy milyen részletességű adatbázist használhatunk bennük, ami ugyebár nem utolsó szempont, mert minél bővebb a rendelkezésre álló minta, annál pontosabban sikerül a felismert hangok szöveggé konvertálása.
Alapvetően a MacWhisper és a MacWhisper Pro egyaránt képes több mint 100 nyelven felismerni a hanganyagokat. Angol nyelv esetében az ingyenes változat is szinte hibátlanul teljesít, de például magyar nyelvű felvételek esetében sajnos sokkal jobban járunk, ha megvásároljuk a Pro verziót és kapásból a Large adatbázist töltjük le (ez egyetlen kattintással megoldható a program felületén). Ez ugyan méretes (a cikk készültekor épp 3 GB) és persze a felismerési folyamat is lassabb, ha ezt használjuk, de cserébe a szövegfelismerés – jó minőségű, nem túlságosan zajos felvételek esetében – szinte perfekt.
Ha valaki spórolni a hellyel a gépen, vagy gyorsítaná a felismerési folyamatot, letöltheti a kisebb adatbázisokat is, de minél jobban visszavesszük az adathalom méretét, annál inkább csökken a felismerés pontossága. További helytakarékossági lehetőség, hogy aki csak angol nyelvű anyagokkal dolgozna, annak akadnak kisebb fájlméretű modellek is. A felismert szövegeket egyébként javíthatjuk is a felületen, ráadásul közben visszajátszhatjuk a hangfelvétel adott részletét, így könnyedén kigyomlálhatjuk a szövegfelismerés esetleges hibáit. Ha egy adott szót konzekvensen rosszul ismert fel a program, akkor van lehetőség akár egy lépésben is lecserélni azt a szerkeszthető szövegben.
A MacWhisperben dolgozhatunk más programban készült hangfelvételekkel – akár a macOS saját Voice Memos hangrögzítőjéből is átránthatunk bele felvételeket -, de van egy New Recording gomb is a felületen, amellyel közvetlenül a programban rögzíthetünk beszélgetéseket. Forrásként egyébként választhatunk .mp3, .wav, .m4a, .mp4, .mov hang- és videófájlokat egyaránt. Sőt, akár Youtube linket is megadhatunk forrásként.
Mind a videók feliratainak készítéséhez, mind egy megbeszélés leiratának készítésekor jól jöhet, hogy a program képes időbélyegzővel ellátni a szövegeket. Így a végeredmény lehet egy .srt vagy .vtt formátumú feliratfájl, vagy akár egy .csv fájl is az időpontok jelölésével. De ha nem érdekes az időbélyegző, menthetünk egybefüggő szöveget is, egyszerű .txt szövegfájlba.
Mindent egybevetve a MacWhisper egy kifejezetten jól sikerült fel- és leiratozó alkalmazás macOS-re, azonban az ingyenes változata jelenleg magyarul azért kevésbé meggyőző. Ha valakinek fontos a magyar nyelvű anyagok feldolgozása, érdemes megvásárolnia a Pro verziót. De aki főként angol nyelvű hangfájlokkal és videókkal dolgozna, annak valószínűleg megteszi majd az ingyenes változat is.
Értékelés
MacWhisper Pro
A MacWhisper Pro segítségével feliratokat és leiratokat készíthetünk hangfelvételekből, az OpenAI Whisper technológiára alapozva. Akár magyar nyelvű felvételekkel is használható.
IGEN
- Hatékony OpenAI Whisper technológia
- Magyar nyelvű felvételeket is leiratozhatunk
- Időbélyegző a leiratokhoz (CSV exporttal)
- SRT és VTT formátumú feliratfájlok készítése
- Sok népszerű hang- és videoformátumot támogat
- Ingyenes változata is van
NEM
- Az ingyenes változat a magyar nyelvű hangfelismerésben nem megbízható
- Nincs fordítási funkció
- Viszonylag lassú a feldolgozás a Large csomag esetén
Értékelés részletei
-
Felület
-
Funkciók
-
Használat










