Arra már többször is mutattunk példát, miként lehet felhasználni a számítógépet és az okostelefont arra, hogy pillanatok alatt megoldjunk matematika feladatokat, lefordítsunk szövegeket, átváltsunk mértékegységeket. Ezek napi szinten előkerülő rutinfeladatok, amelyek bárkivel szembejöhetnek. Ugyanígy gyakran előfordulhat az is, hogy látunk egy képet, amelyről szeretnénk többet megtudni. Az már mindegy is, hogy pusztán a kíváncsiságunk hajt minket, vagy egy tanórán kaptuk ezt feladatul. A lényeg: az MI még egyszerűbbé teszi e feladat megoldását, mint eddig bármi. A képek tartalmának elemzése mesterséges intelligenciával villámgyorsan és rendkívül könnyen megoldható. Ráadásul akár teljesen ingyen is.
Képek tartalmának elemzése mesterséges intelligenciával, egyszerűen
A feladat elvégzéséhez immár három remek AI chatbot is a rendelkezésünkre áll, amelyek gond nélkül kielemeznek nekünk egy képet. Legyen szó egy szimpla fotóról, amely mondjuk egy számunkra ismeretlen állatfajt / épületet / helyszínt ábrázol, vagy egy festményről, szoborról készült fényképről, amelyen szeretnénk beazonosítani a látványt, a mesterséges intelligencia nagy segítség lehet ebben.
Mondjuk azzal azért érdemes tisztában lenni, hogy az AI chatbotok korántsem tévedhetetlenek ezen a téren, de például a híres műalkotásokat, az állatokat, az autómárkákat stb. egészen jól azonosítják a képeken.
Mindennek persze előfeltétele, hogy az adott chatbot egyáltalán képes legyen feldolgozni az általunk mutatott képet. Erre a jelenlegi három legnépszerűbb MI-alapú csevegő – Google Bard, ChatGPT, Bing Chat – mindegyike képes. Még a módszer is azonos, egyszerűen írjuk be kérdésként például azt, hogy “Mit ábrázol ez a kép?”, majd másoljuk utána az adott kép közvetlen URL címét és nyomjuk le az Enter billentyűt (vagy kattintsunk a Küldés gombra a felületen). De egyiküknél azért akad egy kis kihívás:
- Google Bard: A Google Bard – itt írtunk róla tesztet – gond nélkül megkérhető egy kép elemzésére. Mivel e pillanatban még nincs hivatalos Google Bard app okostelefonokra, így feltölteni vagy készíteni nem tudunk fotót, de ha a weben megtaláljuk valahol és tudunk hozzá közvetlen URL címet adni, a Bard ügyesen kielemzi annak tartalmát.
- Bing Chat (Bing AI): A Bing Chat ennél is tovább megy. Gond nélkül elemzi a képeket, fotókat a webes felületen az URL címük megadásával, de ha a Bing appban használjuk iOS vagy Android alatt, akkor arra is van lehetőségünk, hogy az okostelefon kamerájával készítsünk fotót és annak tartalmáról kérjünk szöveges elemzést. A fogd és dobd módszert alkalmazva egyébként működik a dolog az asztali böngészőben használható változatban is.
- ChatGPT: A mesterséges intelligencia hétköznapi népszerűségét megalapozó ChatGPT is rávehető a képelemzésre, ez azonban az ingyenes változattal nem megoldható, lévén csak a GPT-4 nyelvi modell esetében tud képet elemezni, amihez viszont ChatGPT Plus előfizetés szükséges. Ráadásul a ChatGPT alapból nem lát rá az online tartalmakra, így ahhoz, hogy az elemezésre szánt kép linkjét megadhassuk neki, szükség lesz egy olyan ChatGPT plug-inre is, amely eléri a webes linkeket. Ilyeneket bemutattunk korábban ebben a cikkben. Sajnos ezek használatához is ChatGPT Plus előfizetésre van szükség.
A fentiek alapján – jelen pillanatban – a ChatGPT kevésbé jó választás erre a feladatra, mint a Google Bard vagy a Microsoft Bing Chat, de természetesen egy ChatGPT Plus előfizetés birtokában azzal is elérhetjük a kívánt eredményt. A Bard és a Bing viszont ingyen és bérmentve elemez, s ebben a körben egyelőre a Bing vezet, lévén arra is képes, hogy ne az egy URL címként megadott képfájlról, hanem egy okostelefonnal frissen készített fotóról is elmesélje, mit ábrázolhat.








