Google I/O 2026: Antigravity 2.0, Gemini 3.5 Flash és az Agentek Kora
A Google I/O 2026 igazi üzenete nem egyetlen modell volt, hanem az agent-first infrastruktúra: Gemini 3.5 Flash, Antigravity 2.0, Search agentek és új kreatív workflow-k.

Nagyon sokan nagyon sokat beszéltünk az AI agentekről, de a Google a 2026. május 19-i I/O-n (ez a fejlesztői konferenciájuk) azt mutatta meg, hogyan néz ki ez akkor, amikor az agentek már nem különálló feature-k, hanem egy teljes ökoszisztéma részei. A tegnapi bejelentéseket könnyű lenne külön-külön csak végigvenni, de szerintem nem ez a lényeg, hanem hogy a nagy összkép mit mutat.
Mert a termékek/funkciók modellek felsorolása mögött a fontosabb olvasat az, hogy a Google elkezdte egyetlen irányba rendezni a modellt, az agent-harness réteget, a Search-öt, a kreatív eszközöket és az "ambient interface"-eket. Vagyis nem egyszerűen jobb válaszokat akar adni, hanem olyan rendszereket épít, amelyek képesek dolgozni helyetted, állapotot megtartani, párhuzamosítani és egy használható eredménnyel visszatérni.
Ez pedig óriási különbség. Az AI-termékek jelentős része ma még mindig a “jó asszisztens” szinten mozog: válaszol, összefoglal, ötletel. A Google tegnapi demói és blogposztjai viszont inkább arról szóltak, hogy mi történik, amikor az AI már nem egy chatablak, hanem egy operációs réteg.
Antigravity 2.0 és a Gemini 3.5 Flash: A motor és a kasztni
A legfontosabb bejelentés egyértelműen a Gemini 3.5 Flash érkezése volt, amely a Google új, akcióra és "Frontier" intelligenciára fókuszáló modellje. A Google saját közlése szerint a modell több agentes és kódolási benchmarkon felülmúlja a Gemini 3.1 Pro-t, miközben a kimeneti tokenek sebességében nagyjából négyszer gyorsabb más élvonalbeli modelleknél. Ez nem csak benchmark-hír. Agent workflow-ban a sebesség nem kozmetika, hanem a UX része.
Bár a benchmarkok azt mutatják, hogy a kódolás terén hatalmasat lépett előre, és a kimeneti tokenek (output speed) tekintetében négyszer gyorsabb, mint a többi élvonalbeli (vagyis frontier) modell, az igazi erejét pedig az mutatta meg, hogy ezt az Antigravity 2.0 nevű környezetben demonstrálták.
Az Antigravity 2.0 egy új, önálló asztali alkalmazás, amelyet teljes mértékben az ügynök-alapú (agent-first) élményre optimalizáltak. Kifejezetten az ügynökökkel folytatott beszélgetésekre, az általuk készített fájlok (artifacts) kezelésére és a több ügynök együttes irányítására fókuszál. A hivatalos leírás alapján dinamikus sub-agenteket, ütemezett háttérfeladatokat és több felület közötti integrációt is kapott, miközben ugyanennek a harnessnek a részei megjelentek a Gemini API managed agentjeiben és a Google AI Studio körül is. A koncepció és az implementáció is eléggé hasonlít a Codex-ére, ami nem véletlen.
A gyors modell önmagában még nem elég. A gyors modell akkor válik igazán hasznossá, ha egy olyan környezetbe kerül, amelyik tud állapotot tartani, eszközt használni és több lépést végigvinni.
Nem vártam, azonnal kipróbáltam a Gemini 3.5 Flash-t az Antigravity 2.0-n belül. Az inputok feldolgozásánál és a gondolkodásnál még nem láttam megmutatkozni az ígért gyorsaságot, de amikor az eredmények generálására került a sor, az ördögi gyorsasággal történt. A kiadott kódolási feladatot nagy körültekintéssel végezte, és proaktívan javasolt egy olyan megvalósítási módot, amire explicit nem kapott utasítást, de sokkal jövőállóbb lett tőle a megoldás.
Miért nagyobb történet ez, mint egy új modell?
Szerintem az igazi bejelentés nem is maga a 3.5 Flash volt, hanem az, hogy a Google egyre explicitebben épít agent-operációs környezetet.
Az elmúlt két évben rengeteg AI-termék valójában abból állt, hogy valaki egy modellt beletett egy chatfelületbe, majd remélte, hogy a prompt elvégzi helyette a terméktervezést. Az Antigravity mögötti gondolkodás ennek az ellentéte. Itt már külön runtime-ról, execution boundary-ról, párhuzamosított sub-agentekről, ütemezett feladatokról és tartós munkamenetekről beszélünk.
Ez pedig nem csak fejlesztői ügy. Ha ez a réteg elkezd stabilizálódni, akkor a termék, design és operations oldalon is teljesen más kérdéseket kell szvsz feltenni. A “milyen promptot írjunk” helyett az lesz a fő kérdés, hogy:
- hol fusson háttérben az agent,
- mit csinálhat autonóm módon,
- mit kell jóváhagynia a usernek,
- hogyan látszódjon a teljes reasoning és a haladási állapot,
- és hol iktatunk be review loop-ot.
Mi vár a designerekre?
Amíg a fejlesztők az Antigravity-vel fognak játszani (meg én is), a vizuális szakemberek, designerek és videósok munkafolyamatai is drasztikusan változhatnak az új bejelentésekkel:
- Google Pics: Egy teljesen új képalkotó és szerkesztő eszköz a Google Workspace-ben. A lényeg nem csak az, hogy képet generál, hanem hogy precíz kontrollt ad: objektumszintű szerkesztést, képen belüli szövegmódosítást, Workspace-integrációt és kollaboratív vásznakat. Ez sokkal közelebb van a valós kreatív munkához, mint a “generálj valami szépet” típusú eszközök.
- A "Nano Banana" pillanat a videózásban (Gemini Omni): Az új Omni modell a Google szerint bármilyen bemenetből képes alkotni, videóval kezdve, és természetes nyelven vezérelhető szerkesztést hoz a Flow-ba. A gyakorlati következmény az, hogy a videós workflow egyre kevésbé különálló toolok lánca lesz, és egyre inkább egy beszélgetésalapú, mégis precíz szerkesztési folyamat.
- Google Flow és Flow Tools: A Flow Agent immár a kreatív folyamat több pontján tud partnerként működni: ötletel, variációkat gyárt, batch editál, asseteket rendez. A Flow Tools pedig talán a legfontosabb réteg: természetes nyelven lehet velük saját, egyedi workflow-eszközöket készíteni. Ez azt jelenti, hogy a designer nem csak használ egy szoftvert, hanem egyre inkább magára tudja szabni a szoftver működését.
Aki még mindig úgy kezeli az AI-t, mint egy egyszeri tartalomgenerátort, az pont a lényeg mellett megy el: a Google megoldásai most kezdenek rendes munkafolyamat-infrastruktúrát alkotni.
További említésre méltó apróságok
A fentieknél kisebbnek tűnnek, de stratégiailag ugyanabba az irányba mutatnak a további bejelentések is.
A Gemini Spark egy 24/7-ben futó személyes agent, amely a Google közlése szerint a digitális életed menedzselésére készült, és mélyen integrálódik a Workspace-eszközökbe. Ez már nem reakció egy promptodra, hanem folyamatos háttérmunka a te irányításod alatt.
A Google Search megkapja az első information agenteket, amelyek folyamatosan figyelnek egy témát a weben, és szintetizált update-eket küldenek. Emellett a Search egyre inkább képes lesz dinamikus, kérdésre szabott interaktív UI-kat, vizuális eszközöket és miniappokat összerakni valós időben (helló generatív UI). Ez fontos váltás: a kereső nem csak találatokat ad, hanem egyre inkább adott feladat elvégzésének a felületévé válik.
És végül ott van a hardveres irány: a Google első audio glasses terméke idén ősszel érkezik. Kijelző nélkül, diszkrét audio-interfészen keresztül ad hozzáférést a Gemini-hoz. Ez azért érdekes, mert arra a feltételezésre épít, hogy ha az agent-réteg elég hasznos és elég perzisztens, akkor már nem kell hozzá külön appot megnyitni. Egyszerűen ott lesz.
A lényeg
A Google I/O 2026 legfontosabb üzenete szerintem nem az egyes új feature-ök listája volt, hanem egy magát megmutatni kezdő egységes termékfilozófia.
A Google egy olyan világ víziójára épít, ahol az AI nem egy eseti eszköz, amit néha megkérdezel valamiről, hanem egy operációs réteg (vagy -rendszer), ami képes tervezni, monitorozni, szerkeszteni, generálni és cselekedni különböző kontextusok között és kontextusokon átívelően. A Gemini 3.5 Flash ehhez ad sebességet. Az Antigravity 2.0 ehhez ad runtime-ot. A Search agentek, Spark, Pics, Omni és Flow Tools pedig megmutatják, hogyan terül szét ez a logika a mindennapi digitális munkában.
A gyakorlati tanulság egyszerű: ha most digitális termékeket tervezel, ne csak promptokban és outputokban gondolkodj. Inkább agent-környezetekben, a munkavégzés egyre táguló határaiban, review loopokban, bizalmi pontokban és csendben, a háttérben futó Agent munkában gondolkodj, UX mellett már az AX-ben (Agentic Experience) is gondolkodni kell.
Na, most kezdett el ez igazán érdekes lenni. És a héten lehet, hogy még jön a Sonnet 5 és a GPT5.6, vagy valami teljesen más...
További írások az archívumból
9 Months of Customizing Claude Code: What I Built and Why
How I turned Claude Code from a default AI assistant into a personalized workflow — 9 skills, 55 plugins, daily routines, and the philosophy behind it all.
Az appok utáni világ már nem elmélet, és a Codex ezt mutatja
Elon Musk jóslata túlzó, de a Codex megjelenése a ChatGPT appban már most megmutatja, merre megy a szoftverhasználat.
Ehhez a gondolathoz kapcsolódó projektek
Open Brain: Building a Personal Knowledge Backend with AI
Open Brain: Building a Personal Knowledge Backend with AI What if your notes could think? Not in a sci fi way — but in a practical, "I wrote something three months ago th…
Raiffeisen Bank: End-to-End Online Account Opening
Raiffeisen Bank: End to End Online Account Opening When Raiffeisen Bank decided to let customers open a bank account entirely online — no branch visit required — they kne…