• Autor: Abram Svoboda
Letošní Google I/O bylo o jediném – o agentní éře Gemini. Nový model 3.5 Flash, osobní agent jménem Spark, vyhledávání přepracované od základu po sedmadvaceti letech a první oficiální detaily o chytrých brýlích, na kterých Google dělá společně se Samsungem. Co to všechno znamená v praxi a kdy se to k nám dostane?
Google I/O je každoroční vývojářská konference, kde Google ukazuje, kam celá firma směřuje – a letošní ročník byl asi nejvíc soustředěný v historii. Téměř všechno se točilo kolem agentní AI, tedy myšlenky, že Gemini nebude jen chatbot, ale samostatný asistent, který za vás dělá věci v reálném světě. Dvouhodinový keynote byl nabitý jako nikdy. Pojďme si projít, co stojí za zapamatování.
Začněme tím, co všechno ostatní pohání. Gemini 3.5 Flash je nový model, který Google staví jako svůj „daily driver" – cílem je nabídnout výkon srovnatelný s nejlepšími modely na trhu, ale za výrazně nižší cenu a hlavně s mnohem rychlejším výstupem. V praxi to znamená čtyřikrát rychlejší generování oproti konkurenčním frontier modelům a velký posun v kódování i v řešení reálných úkolů (benchmark GDPVal). Zajímavé je, že 3.5 Flash překonává starší Gemini 3.1 Pro téměř ve všech ukazatelích – takže to není „menší" varianta, je to nová generace.
Model je dostupný od dneška napříč všemi produkty a API. Verze Gemini 3.5 Pro je v interním testování a měla by přijít příští měsíc. Sundar Pichai zmínil, že Google sám interně zpracovává přes tři biliony tokenů denně pomocí Antigravity a Gemini 3.5 – z čehož je vidět, že tempo nasazování AI ve firmě výrazně zrychluje. A jak si ukážeme dál, 3.5 Flash je něco jako neviditelný motor téměř všech dnešních oznámení.
Tohle bylo asi nejvíc emocionálně podané oznámení celé konference. Gemini Spark je osobní AI agent přímo v Gemini aplikaci, který za vás dělá věci, i když máte notebook zavřený. Běží totiž na vyhrazených virtuálních strojích v Google Cloudu, takže nepotřebuje vaše zařízení – pracuje 24/7 na pozadí a vy se k němu vracíte, kdykoli vám to vyhovuje.
Pod kapotou je kombinace Gemini 3.5 a vývojářské platformy Antigravity, díky které Spark zvládá dlouhotrvající úkoly – ne jen jednorázové otázky, ale třeba „najdi mi dovolenou pro dva v Toskánsku v září do dvaceti tisíc, srovnej hodnocení a pošli mi tři finální možnosti". Spark se napojuje na nástroje – nejprve na samotné Google služby, během několika týdnů i na třetí strany přes protokol MCP. Pracovat s ním budete moct v Gemini aplikaci, později i přes e-mail nebo chat.
Na Androidu dostane Spark vlastní rozhraní – tzv. Android Halo, kde uvidíte živé updaty a stav úkolů, které pro vás agent řeší. Spark se má později v létě dostat i přímo do Chromu jako agentní prohlížeč, který umí brouzdat web místo vás. Beta startuje příští týden, zatím jen pro předplatitele Google AI Ultra v USA – širší dostupnost přijde postupně. Pokud Spark v praxi opravdu zvládne to, co Google ukazoval na pódiu, je to první chvíle, kdy „AI agent" přestává být marketingové slovíčko a stává se z toho něco použitelného.
Google sám popisuje nové vyhledávání jako největší upgrade za více než dvacet sedm let, což zní jako velké tvrzení – ale když se podíváte, co se mění, dává to smysl. Vyhledávací políčko už není jen autocomplete: nově do něj můžete zadat obrázek, soubor, video nebo přímo otevřenou kartu z Chromu a Search z toho udělá kontext pro vaše hledání. AI Mode má od dneška jako základní model Gemini 3.5 Flash a je globálně dostupný pro všechny zdarma.
Důležitější změna ale přichází s Information Agents – personalizovanými agenty, které si nastavíte na pozadí a oni za vás průběžně hledají věci, na kterých vám záleží. Sledujete cenu konkrétního produktu? Čekáte na nové info z konference? Agent vás upozorní, jakmile něco najde. Spouštějí se v létě, zatím pro předplatitele Google AI Pro a Ultra.
A je tu ještě jedna věc, která mi přijde tichá, ale možná zásadní: Search bude umět pomocí Antigravity a Gemini 3.5 Flash vytvářet vlastní interaktivní rozhraní přímo k vaší otázce. Plánujete cestu? Search vám sestaví interaktivní dashboard. Učíte se něco složitějšího? Postaví vám tracker, ke kterému se můžete vracet. Google tomu říká „mini-apps" v rámci Searche a chce to v létě nabídnout všem zdarma. Pokud to bude fungovat tak hladce, jak vypadalo na pódiu, je to zatím nejnázornější ukázka toho, co znamená „agentní AI" v praxi.
Gemini se dostává úplně všude. Ask YouTube umí odpovídat na konkrétní otázky a hlavně skočí přímo na tu část videa, která je pro vás relevantní – konec scrollování přes patnáctiminutové intro, abyste se dostali k jednomu konkrétnímu kroku. Testování startuje teď, široké zapnutí v USA přijde v létě.
Docs Live je další chytrá věc – dokument naplníte prostě tím, že nahlas mluvíte. Žádné formulování přesných promptů, jen řeknete „dej tam tři odstavce o letošním nárůstu tržeb, sekci s grafem a v závěru tabulku" a Gemini to udělá. V plánu je i hlasová úprava existujícího textu. Spouští se v létě pro předplatitele Workspace a stejné hlasové schopnosti se dostanou i do Gmailu a Keepu.
Ke každodennímu používání pak míří Daily Brief – ranní digest, který vám projde inbox, kalendář a úkoly a sám rozhodne, co je důležité řešit dneska. Není to jen sumář, ale i návrh dalších kroků. Google Pics je nový nástroj na tvorbu a úpravu obrázků postavený na modelu Nano Banana, který zachází s každým prvkem na obrázku jako se samostatným objektem – takže můžete měnit dílčí věci, aniž byste museli začínat od nuly.
Loni Google poprvé ukázal koncept chytrých brýlí s Androidem XR. Letos je to konkrétnější – a hlavně, dělá to společně se Samsungem. První na řadě jsou audio brýle, které vypadají jako normální brýle a fungují tak, že vám Gemini „šeptá" do ucha. Žádná obrazovka, žádné AR – jen hlasový asistent ve formátu, který si můžete vzít kamkoli. Dorazí letos na podzim.
Po nich přijdou display brýle s malou obrazovkou, která vám ukáže to, co potřebujete, právě když to potřebujete – navigace, notifikace, překlad. Datum prodeje display brýlí Google zatím neřekl. Spolupráce se Samsungem je tady klíčová: Samsung přináší zkušenost s nositelnou elektronikou a hardwarový design, Google software a Gemini. Pokud to funguje tak hladce, jak to znělo na pódiu, mohlo by jít o první masově použitelné chytré brýle.
Kromě hlavních témat padla na I/O celá řada menších, ale zajímavých oznámení. Antigravity 2.0 je nová desktopová aplikace pro vývojáře – v podstatě centrum, ze kterého řídíte víc AI agentů najednou. Gemini 3.5 Flash v něm podle Googlu běží dvanáctkrát rychleji než konkurenční modely.
Gemini Omni je nová rodina modelů, která generuje libovolný výstup z libovolného vstupu – v praxi začínáme s videem (Gemini Omni Flash je k dispozici od dneška v Gemini aplikaci, v Google Flow a v YouTube Shorts), obrázky a text přijdou postupně. Google také rozšiřuje SynthID, svůj neviditelný vodoznak pro AI obsah – přidávají se k němu OpenAI, Kakao a Eleven Labs a ověřování Content Credentials se dostane do Search a Chromu. Důležitý krok pro to, aby uživatel poznal, co je vygenerované AI a co skutečná fotka.
Z hardwaru zaujmou nové čipy TPU 8t a TPU 8i, kde Google poprvé rozděluje křemík na trénink (8t) a inferenci (8i). Pro běžného uživatele nic přímo viditelného, ale je to právě to, co umožňuje, aby Gemini 3.5 Flash běžel rychle a levně. Z méně zmiňovaného pak Gemini for Science propojuje Antigravity s více než třiceti hlavními databázemi v life science výzkumu a Project Genie od DeepMind ukázal simulaci reálných míst pomocí Street View – z naskenovaného světa se najednou stává „použitelný" 3D prostor pro AI.
Co si z celé show odnést? Tématem je agentní AI – Google už netvrdí, že Gemini je „nový chatbot", staví ho jako vrstvu, která za vás dělá věci v reálném světě. A i když je hodně oznámení zatím ve fázi „brzy, postupně, nejdřív v USA", směr je jasný a tempo, jakým to Google rozjíždí, je působivé. Ostatní teď mají co dohánět.