Józan ésszel az ember azt gondolná, hogy decemberben már nem nagyon érkeznek vadonatúj termékek IT területen, hiszen ez az időszak már inkább a karácsonyi készülődésről szól. Ehhez képest idén elég sok fontos újdonság debütál mifelénk. Pár napon belül megérkezik például a Meta-féle Threads – az egykori Twitter, most X kihívója – az EU-ba is, s a Google is szolgált nekünk még egy izgalmas újítással a bejgli evés előtti időszakra: bejelentették Gemini nevű generatív MI modelljüket. Éppen ezért most röviden összefoglaljuk, hogy pontosan mi is ez a Gemini, mitől olyan érdekes, s hogyan oldható meg a Google Gemini használata a Bardban, vagy egyéb platformokon.
FRISSÍTÉS: A Google 2024. február elején megváltoztatta a Google Bard nevét, amely immár Google Gemini néven érhető el, s ezzel egyidőben számtalan további MI-alapú szolgáltatás is bekerült a Gemini égisze alá. Minderről és a Gemini lehetőségeiről itt olvashatnak.
Mi az a Google Gemini 1.0?
Dacára annak, hogy az OpenAI-féle GPT nagy nyelvi modellek megjelenésekor még úgy tűnt, a Google hirtelen jelentős lépéshátrányba került ezen a területen, a cég meglehetősen gyorsan behozta lemaradását. Sőt, a most bejelentett Gemini adott esetben komoly fejtörést okozhat a konkurenciának.
A Google Gemini 1.0 egy új nagy nyelvi modell (LLM), amelyet már alapjaitól az úgynevezett “multimodality” irányelvek szerint képeztek, így képes szöveg, kép, videó, hang vagy forráskód feldolgozására egyaránt. Ez jelentősen megnöveli a lehetőségeit. Három változatban érkezett:
- Nano: a Nano változat a gyors, helyi feladatokhoz készült, így nagy hasznát vehetik például okostelefonokon és más eszközökön (például érkezik majd a Pixel 8 Pro modellekre, több rendszerfunkció és app alapjaként).
- Pro: A Pro változatnál arra összpontosítottak, hogy minél sokrétűbben lehessen alkalmazni.
- Ultra: Az Ultra változat a legerősebb és legrugalmasabb, de cikkünk készültekor ez még nincs végleges állapotban. Csak 2024-ben lesz elérhető, és várhatóan – többek között – egy fizetős Bard változat alapját is adhatja majd.
Ezeket a Gemini változatokat rendkívül szigorú körülmények között tesztelték, beleértve ebbe a képek-, hangok- és videók megértésétől, a matematikai következtetésekig mindent. A Google szerint a Gemini Ultra teljesítménye túlszárnyalja az eddigi legjobb eredményeket, vagyis sok esetben hatékonyabb lehet, mint az OpenAI-féle GPT-4. Persze ne legyenek kétségeink, egészen biztosan érkezik majd a GPT-5 is belátható időn belül, de ettől még vitathatatlan, hogy immár mindenkinek komolyan kell vennie a Google-t a generatív mesterséges intelligencia színterén. Ez a verseny innen már csak gyorsulni fog.
Mint már említettük, a Geminit eleve multimodális felépítéssel hozták létre, szakítva az eddigi szokásokkal, amikor a nagy nyelvi modell a különféle formátumú információkat utólagos modulok segítségével igyekszik feldolgozni. A Gemininek mindegy, hogy kép, videó, hanganyag, vagy épp egy forráskód alapján kell-e dolgoznia, akár egyidőben is. Extra kiegészítők nélkül is megoldja ezt a feladatot. Így jobban megérti az árnyalt információkat, s képes megválaszolni bonyolult témákkal kapcsolatos kérdéseket. Alkalmas az olyan összetett tantárgyak érvelésének magyarázatára is, mint a matematika és a fizika.
Mellesleg a tanítása is hatalmas mennyiségű adatkészleten, különféle formátumú adattal történt. Ez alkalmassá teszi számtalan feladatra, a szöveggenerálástól, a fordításon át, a forráskód-, kép- és videogenerálásig.
Google Gemini használata a Bardban
Mindez nagyszerű, de hol lehet kihasználni ezt a mérhetetlen tudást és lehetőséget? Nos, az igazi csúcsot még sehol, hiszen ahhoz az Ultra változatra lenne szükség, amely majd csak jövőre ölt testet. A Nano verzió viszont belátható időn belül érkezhet a Pixel 8 Pro készülékekre, hogy ott vállalja majd magára a szövegek feldolgozását, a levélírást, a csevegések fordítását, s ki tudja még mit, ami jól jöhet egy okostelefonon.
Itt van azonban a Pro verzió, amelyet a Google azonnal elkezdett bevezetni a Google Bard nevű MI-csevegőben. Márpedig a Bard ingyen használható és szinte bármelyik böngészőben működik (asztali és okostelefonos platformokon egyaránt). Szóval ha valaki ismerkedne a Gemini lehetőségeivel, kézenfekvő, hogy ebben a formában teheti ezt meg a legegyszerűbben. Más kérdés, hogy nem feltétlenül landol a frissítés minden felhasználónál egyszerre, ráadásul idehaza várhatóan lassabban érkezik majd meg a GDPR szabályozásoknak köszönhetően (ahogy emiatt maga a Bard is csúszott anno itthon pár hetet). A Google – mint majdnem minden szolgáltatását – ezt is fokozatosan teszi elérhetővé. Az viszont biztos, hogy a magyarországi felhasználók számára is elérhető lesz az új modellre épülő Bard, a már megszokott felületen.
Szóval az eddig megszokott ChatGPT és a Microsoft Copilot MI-csevegők mellett a Geminivel felturbózott Google Bard is a rendelkezésünkre áll, de szeretnénk elmerülni a generatív mesterséges intelligencia világában.








