Ez a weboldal sütiket használ
A jobb szolgáltatás nyújtásának érdekében sütiket használunk. Az oldal jobb felhasználása érdekében kérjük, fogadja el a sütiket. További információ itt: Adatvédelmi tájékoztató
A ChatGPT egy évvel ezelőtti piacra való berobbanása után a nagy techcégek sorban jelentik be és adják ki a mesterségesintelligencia-programjukat, ebből a sorból pedig a Google sem marad ki. Nem sokkal az OpenAI ChatGPT után előálltak a Google Barddal, most pedig a Gemini látta meg a napvilágot, amivel a Google vezérigazgatója, Sundar Pichai szerint egy új AI-korszak kezdődik.
A Gemini névre keresztelt nyelvi modellt a Google először egy júniusi fejlesztői konferencián lengette be, de december közepéig kellett várni, hogy a nyilvánosság is megismerhesse. Sundar Pichai és Demis Hassabis, a Google DeepMind vezérigazgatója a leleplezésen úgy fogalmazott, hogy ez egy hatalmas előrelépés egy olyan mesterségesintelligencia-modell kifejlesztésében, amely a Google összes termékére hatással lesz. Elmondásuk szerint ezzel az AI-val képesek lesznek javítani a szolgáltatásaikat.
A Gemininek van egy egyszerűbb változata is, a Gemini Nano, amelyet natív és offline futtatásra szántak az Android-eszközökön. Ugyanakkor ott van az erősebb verzió, a Gemini Pro, amely már a közeljövőben számos Google AI-szolgáltatást fog működtetni, és amely nem mellesleg a Google Bard gerincét is fogja képezni. Ha mindez nem lenne elég, akkor van egy még ennél is összetettebb algoritmus, a Gemini Ultra, ez a Google eddigi legerősebb mesterségesintelligencia-fejlesztése, amelyet adatközpontoknak és vállalatoknak terveztek.
Ezek mind jól hangzanak, de joggal merülhet fel a kérdés, hogy miben rejlik a Gemini erőssége. Nos, ha szigorúan a számokra hagyatkozunk, akkor elmondható, hogy ahogyan az okostelefonok, laptopok és táblagépek esetében, úgy az AI-szoftverek tekintetében is léteznek benchmarktesztek, amelyek megvizsgálják, hogy szintetikus, előre legenerált körülmények között hogyan teljesít az adott mesterséges intelligencia. Ezek többnyire tényleg nagyon szorosak voltak az elmúlt időben, viszont a Gemini tudott hozni valami újat. A nagy előnye abból származik, hogy képes megérteni a videót és a hangot, továbbá interakcióba is képes lépni ezekkel. Pontosabban sokkal jobban tudja ellátni ezeket a feladatokat, mint más nagy nyelvi modellek. Az már egy másik kérdés, hogy ez mennyire segíti elő a deepfake-et, vagyis azt a folyamatot, amikor látunk például egy videót, amiben egy ismert személy beszél egy összeesküvés-elméletről vagy egy lehetetlen találmányról, esetleg politikai döntésről, amely azonban nem valós, csak a videó megalkotója tette az illető szájába a mesterséges intelligencia segítségével. Természetesen a Google eseményén erről nem volt szó, ahogyan az is tagadhatatlan, hogy a Gemini számos munkafolyamatot képes lesz lerövidíteni és megkönnyíteni.
Az, hogy a Google új nyelvi modellje előtérbe helyezi a videó- és hangfelismerést, egyáltalán nem véletlen. A sokoldalúság első pillanattól része volt a Gemini tervének, hiszen a Google nem alkotott külön modelleket a hangra és a képre, ahogyan a konkurencia tette, inkább létrehozott egy úgynevezett „svájci bicskát”, amely általánosan minden területre alkalmas. A Google DeepMind igazgatója szerint a vállalat mindig is a nagyon általános rendszerekre helyezte a hangsúlyt. Jelenleg a Gemini legalapvetőbb modelljei csak a szöveggel tudnak dolgozni, de például a Gemini Ultra már képes a képek, videók és hanganyagok feldolgozására, alakítására is. Demis Hassabis arról is beszélt a leleplezésen, hogy a Gemini a jövőben több „érzékszervet” is fog kapni, amelyeknek köszönhetően tudatosabbá és pontosabbá válik. Ugyanakkor azt is beismerte, hogy ezek a modellek soha nem lesznek tökéletesen pontosak, és mindig fognak torzításokat hordozni magukban, viszont minél többet tudnak, annál jobbak lesznek.
A már említett benchmarktesztek szerint van olyan terület, ahol tagadhatatlan a Gemini előnye, azonban az igazi próba az lesz, amikor a mindennapi felhasználók fogják a gyakorlatban használni a nyelvi modellt akár ötletelésre, akár információkeresésre vagy informatikai kód megírására. Maga a Google is utóbbiban látja a szoftver egyik legerősebb alkalmazását, nem véletlenül építettek bele egy új kódgeneráló rendszert, az AlphaCode 2-t, amely a vállalat állítása szerint 85%-kal teljesít jobban, mint a konkurencia mesterséges intelligenciáinak kódíró része, illetve 50%-kal jobban, mint elődje, a „sima” AlphaCode.
A Google igazgatói a The Verge amerikai szaklapnak beismerték, hogy már rég dolgoznak a Geminin, a fejlesztést még jóval azelőtt kezdték el, hogy az OpenAI ChatGPT átvette a „világuralmat”. Amikor tavaly az imént említett nyelvi modell lényegében felrobbantotta a piacot, akkor adta ki a Google a vörös kódot, hogy a lehető leggyorsabban el kell készüljön az ő szoftverük is, viszont nem kapkodták el, és nem végeztek félmunkát, keményen dolgoztak a Gemini biztonságának és felelősségének a biztosításán, ezt mind belső, mind külső tesztelésnek alávetették. A Google vezérigazgatója rá is mutatott, hogy az adatbiztonság és a megbízhatóság különösen fontos vállalati cél minden termékük esetében.