Az idei évet – IT szempontból – egészen biztosan a generatív mesterséges intelligencia, amely egyaránt hasznos lehet az üzleti életben, otthon, vagy sajnos akár a kiberbűnözők számára is. Szinte minden területen érezhetjük a hatását, de nem feltétlenül kell bonyolult dolgokban gondolkodni. Teljesen hétköznapi esetekben is hasznát vehetjük. Ehhez azon most néhány ötletet, amikor megmutatjuk, melyek lehetnek a legjobb AI eszközök 2024-re.
A legjobb AI eszközök 2024-re
Elöljáróban annyit azért megjegyzünk, hogy ez tipikusan egy olyan cikk, amelynek írását nem lehet befejezni, csak abbahagyni. Ráadásul még csak 2023 végén vagyunk, így még csak azok az eszközök szerepelhetnek itt, amelyek ezidáig már bizonyítottak. Ilyenekből azonban van több is, így összeválogattuk őket egy helyre. S ettől függetlenül persze elég nagy az esélye, hogy jövőre még bővül majd a lista újabb darabokkal, amelyekről majd írunk önálló teszteket itt, a Techwokon.
Mivel a legtöbb eszközt már teszteltük részletesen, most csak rövid összefoglalókat adunk, s linkeljük a bővebb teszteket róluk. A legtöbb egyébként használható ingyen is, akár próbaváltozat formájában, akár egy tudásában kicsit visszafogottabb ingyenes verzióként. De akad olyan is, amit teljesen ingyen vehetünk igénybe.
ChatGPT (Plus)
Kezdjük a megkerülhetetlennel, az AI-alapú csevegővel, amely elindította a lavinát, s amely időközben a mesterséges intelligencia szinonimájává vált, ami részben persze igaz, de amúgy némileg túlzás.
Ettől még persze nem lehet elvitatni, hogy a ChatGPT a legjobb megoldás most a kategóriájában, különösen ha nem ragadunk le az ingyenes verziónál, hanem előfizetünk a ChatGPT Plus szolgáltatásra. Ettől kezdve létrehozhatunk akár teljesen saját, testreszabott GPT-ket is, meghatározott feladatok hatékonyabb megoldására, de arra is van mód, hogy analitikákat készítsünk, vagy épp képeket generáljunk a DALL-E 3 képgeneráló motorra építve. Emellett pedig akár naprakész, friss webes adtok alapján is tud nekünk segíteni a ChatGPT, ha előfizetünk rá.
Ráadásul, mint az majd lentebb kiderül, számtalan szoftver és online szolgáltatás épít a ChatGPT alapján is képező GPT-3.5 és GPT-4 nagy nyelvi modellekre, illetve az OpenAI további, a fejlesztők számára API-ként elérhető szolgáltatásaira (Whisper, DALl-E 3 stb.).
Adobe Firefly és Adobe Photoshop
Idén az Adobe is nagyot futott a generatív mesterséges intelligencia integrálásával az Adobe Creative Cloudba. Többek között a Photoshopba is beépítették saját, Firefly elnevezésű képgenerálójukat, amely azonban a képek leírás alapján történő létrehozásán túl akár meglévő fotók retusálásában, kiegészítésében is tud segíteni.
Gyakorlatilag egy-két kattintással lehet benne megoldani olyan képszerkesztési feladatokat, amelyekkel korábban akár órákat is el lehetett vacakolni. Ez azért elég döbbenetes újdonság produktivitás szempontjából. Ráadásul ezzel a Photoshop is visszanyerte piacvezető helyét az olyan erősen feltörekvő konkurensekkel szemben, mint mondjuk az Affinity. Részletesen itt írtunk ezekről az újdonságokról.
Microsoft Copilot
Természetesen a Microsoft is igyekezett lépést tartani, s ez – mivel a legtöbb funkciót az OpenAI-féle ChatGPT-re, pontosabban az annak alapján adó GPT-4 nagy nyelvi modellre és a DALL-E képgenerálóra alapozták – elég jól sikerült. Az említett AI megoldásokat egyesítették a Bing kereső lehetőségeivel, majd az így kapott eszközt apránként beépítették mindenhova: a Microsoft 365 irodai alkalmazásaiba, a Windows 10 és Windows 11 rendszerekbe, s még egy sereg Microsoft programba és szolgáltatásba (Outlook, Teams, Skype, Loop stb.).
Emellett pedig Microsoft Copilot névre keresztelve megtartották az egész alapját képező, a GPT-4 modellre épülő csevegőt is, amely immár önállóan, a Bing kereső felületétől függetlenül – de továbbra is építve a Bingre – érhető el. Részletesen itt írtunk erről.
Microsoft Designer
Ha már Microsoft, akkor nem mehetünk el szó nélkül egy másik olyan eszközük mellett sem, amelybe szintén több szálon integrálták a generatív mesterséges intelligenciát. A Microsoft Designer tud képeket létrehozni szöveges leírás alapján, majd azokat a témához illő környezetben tálalni, akár animált bannerként, akár nyomtatható kiadványként. Részletesebben itt mutattuk be.
Google Bard
Természetesen a Google sem akar lemaradni az AI-őrületről. Több szolgáltatásukba és alkalmazásukba beépítették már saját megoldásaikat, s mi sem természetesebb, mint hogy van saját AI-csevegőjük is, Google Bard néven. Ennek használatáról és lehetőségeiről írtunk már többször is, például ebben a cikkben.
A Google idén decemberben bemuttata Gemini elnevezésű nagy nyelvi modelljét (LLM), amelyet elődeinél jóval nagyon adatbázison képeztek. Ráadásul a Geminit már az alapoktól multimodality formában tervezték meg, hogy képes legyen szöveg, kép, videó és hang feldolgozására, így többféle forrást is használhatunk bemenetként. Ez az új modell három változatban készült el: Nano, Pro és Ultra. E három verziót különféle felhasználási területekre optimalizálták, így például a Nano a gyors helyi feladatokra összpontosít (ez teljesíthet majd okostelefonos rendszerekben is, például a Pixel 8 Pro készülékeken), a Pro amolyan sokoldalú középutat képvisel (ez dolgozik mostantól a Google Bard Ai chatbotban), az Ultra pedig a legrobosztusabb választás. Utóbbi amúgy még fejlesztés – és biztonsági ellenőrzések – alatt áll, így jövőre lesz csak elérhető, akkor viszont várhatóan egy fizetős Bard változat alapját is adhatja majd.
Szóval a Google Bard ebből a szempontból is izgalmas választás lehet majd jövőre, hiszen a Gemini modellre épülve már igen komoly vetélytársa lesz az OpenAI-féle GPT-4 modellre épülő ChatGPT és Microsoft Copilot MI-csevegőknek.
NightCafe Studio, Leonardo.ai, Draw Things
Képgenerálókkal mára Dunát lehet rekeszteni, de ha ki kellene emelnünk kettőt az idei felhozatal legjobbjaiból, akkor az egyik a NightCafe Studio lenne, a másik pedig a Leonardo.Ai. Mindkettő online használható a webböngészőben, s mindkettőnek vannak ingyenes funkciói, illetve előfizetéssel vagy kreditek vásárlásával elérhető extráit. Szerintünk mindkettőt érdemes kipróbálni.
Emellett, aki erősebb Macet használ, akár offline is munkára bírhatja a Stable Diffusion XL-t és más képgeneráló modelleket, ha telepíti a Draw Things nevű alkalmazás macOS-re. Erről itt írtunk részletesebben.
Luminar Neo
A mesterséges intelligencia és a gépi tanulás nem csak a sosemvolt képek létrehozásában segíthet, hanem abban is, hogy fotóinkat gyorsabban és hatékonyabban retusálhassuk. Erre kiváló példa a Luminar Neo nevű alkalmazás, amely temérdek AI/ML alapú funkcióval segíti a fotósok munkáját. Részletesen itt írtunk róla. Elérhető Windowsra és macOS-re egyaránt.
Alrite
Nem idén kezdte a pályafutását, így aztán visszatérő vendégünk a hazai fejlesztésű Alrite, amely jelen pillanatban a legjobb beszédfelismerő szoftver magyar nyelven. De amúgy nem csak magyarul lehet vele leiratokat és feliratokat készíteni hangfelvételekből vagy videók hangsávjából, hanem angol, német, spanyol és francia nyelveken.
Villámgyorsan és megfelelő minőségű felvétel esetén gyakorlatilag hibátlanul alakítja át a hangfelvételeket leírt szövegekké vagy épp filmekhez használható srt feliratokká. De az sem okoz neki gondot, hogy ráégesse a kész feliratot a videóra, vagy épp lefordítsa más nyelvre a felismert szöveget. Részletesen itt írtunk róla.
Molin AI
Szintén hazai fejlesztésű online szolgáltatás a Molin AI, amely eredetileg tartalomgenerálásra volt hivatott, de mostanra már van belőle webshopokba, honlapokba beépíthető AI segéd is. Szövegírási képességeit részletesebben itt mutattuk be.
Craft
Maradjunk még mindig a Magyarországról indult fejlesztéseknél. Ezek egyik jeles képviselője a Craft nevű jegyzet- és dokumentumkészítő alkalmazás, amely ebben a kategóriában kétség kívül az élvonalat képviseli. Ráadásul ebbe is integrálták a generatív mesterséges intelligenciát, így képes vázlatokat, vagy akár teljes szövegeket megírni helyettünk, illetve lefordítani a jegyzetek szövegeit, vagy megírni helyettünk FB és Twitter posztokat.
Persze teljesen hétköznapi jegyzet alkalmazásnak is kitűnő választás, de ha kihasználjuk a virtuális AI asszisztens nyújtotta lehetőségeket, akkor még produktívabbak lehetünk a segítségével.
Spark Mail
Miként a jegyzeteknél, úgy a levelezésnél is jó szolgálatot tehet bárkinek a MI. A Spark Mail az egyik legjobb alternatív levelező kliens, amelybe erősen integrálták a GPT nyelvi modellt. Így aztán képes megírni helyettünk leveleket, vagy lerövidíteni, esetleg kiegészíteni az általunk megírtakat.
Ugyanígy összes tudja foglalni a beérkező, hosszabb e-mailek tartalmát egy gyorsabban emészthető változattá. Mindezt asztali rendszereken (Windows, macOS) éppúgy, mint okostelefonokon (iOS, Android). Szóval bárhol, bármikor hasznát vehetjük, ha szeretnénk leegyszerűsíteni a levelezésünket. Részletesen itt mutattuk be a lehetőségeit.
Stable Audio
Végül mutatunk még egy olyan eszközt is, amely jelenlegi formájában még nem tekinthető különösebben kiforrottnak, de mivel anno a Stable Diffusion képgeneráló modell is így kezdte, mi megelőlegezzük a bizalmat, s már most ajánljuk az ismerkedést a Stable Audio szolgáltatással.
Nevéből könnyen kikövetkeztethető, hogy ezzel nem képeket, hanem zenéket tudunk létrehozni, szöveges leírás alapján. Szóval csak közbeírjuk, hogy nagyjából mit szeretnénk hallani, a webes alkalmazás pedig elkészíti a dalt. Vagy legalábbis megpróbálja. Várhatóan pár hónap múlva azért majd többre is képes lesz, márpedig abban az esetben igencsak megkönnyítheti bárki dolgát, aki Youtube videójához vagy egyéb projektjéhez szeretne egyedi zenét létrehozni, zenei képzettség és hangszerismeret nélkül. Anno itt mutattuk be.










