• Autor: Jan Vavřík, Ondřej Chabr
Velký den společnosti Google. Všechny zraky technologického světa jsou upřeny na konferenci Google I/O 2025, která dne 20. května v kalifornském Mountain View odhaluje své novinky. Letošní ročník se nese ve znamení umělé inteligence, která se stává klíčovým prvkem napříč celým ekosystémem Google. Troufám si říct, že slovo Gemini už není světu neznámý, setkáváme se s ním prakticky všude. Co vše hlavní keynote přinesla?

Velkou část celé keynote se nesla ve znamení umělé inteligence Gemini. Jak jistě víte, jedná se o pokročilý AI model od Googlu, se stává centrálním prvkem napříč platformami společnosti. Už dnes nám umí vyhledat věci z e-mailu, zapsat schůzku do kalendáře či najít odpověď na řadu problémů, které potřebujeme řešit. Podle Google se nový Gemini 2.5 Pro stane ještě chytřejší, než je tomu doposud. Do Gemini přibyl nejnovější model Imagen 4 pro ještě lepší vykreslení obrázků s detailními prvky.
Model Gemini 2.5 Pro se dle Googlu řadí mezi technologickou špičku díky své schopnosti zvládat složité výpočetní úlohy, vytvářet pokročilý kód a navrhovat multimodální aplikace, které propojují text, obraz i zvuk. V testech výkonnosti 2.5 Pro dosahuje vynikajících výsledků, ať už jde o matematické výpočty, vědecké analýzy nebo programátorské úlohy. Nově je zde Deep Think, tedy to, že model bere v potaz více možných odpovědí na danou otázku.
Novinkou je také mobilní aplikace NotebookLM, která umožňuje vytvářet AI generované shrnutí a podcastové přehledy, což usnadňuje multitasking a zvyšuje produktivitu. Aplikace je poháněna modelem Gemini 2.5 Flash. To je nový jazykový model určený pro efektivní přemýšlení. Zvládne i dlouhé texty nebo pomoc s programováním.
Nejvyšší verzí balíku AI od Google je aktuálně Gemini Ultra, který je však dostupný jen pro americké zákazníky za cenu téměř 250 dolarů měsíčně. Zahrnuje přístup k video generátoru Veo 3 schopného generovat až filmové záběry, aplikace Flow, model hloubkového zkoumání Gemini 2.5 Pro Deep Think, YouTube Premium či 30 TB místa pro Google Drive, Google Photos a Gmail.
AI se nicméně bude již nyní integrovat přímo do vyhledávače, a to i pro české uživatele. Generované odpovědi se nám zobrazí pod vyhledávacím políčkem jako tzv. AI Overviews. V mnoha případech se tedy při zadání jasně strukturovaného dotazu lze odpověď dozvědět bez nutnosti navštěvovat konkrétní webovou stránku. Jak to bude mít vliv na návštěvnost webů, to se teprve uvidí.
Umělá inteligence se postupně stane klíčovou součástí aplikací jako Gmail, Dokumenty (Docs), Tabulky (Sheets) a zmíněného Vyhledávání (Search) a Cloud. Kromě toho je v plánu spuštění nových projektů, jako je Project Astra a Project Mariner, které mají přinést pokročilé možnosti automatizace a personalizace uživatelských zážitků. Stačí jim zadat úkol, třeba vyhledat hotelové pokoje v daném cenovém rozmezí pro určitý počet osob, Mariner vše vyhodnotí a nabídne výsledky.
V tzv. AI Mode může uživatel vkládat vstupy textové i obrazové a v tomto režimu zmiňuje třeba nakupování. Stačí vložit svou fotografii a následně fotografii líbivého outfitu. Umí obrázky spojit a na vaši postavu napasovat dané oblečení. Funkce Google Beam zase nabídne pocit z videotelefonování, jako by účastníci byli přítomni vedle sebe.
Po předchozích pokusech, které nenaplnily očekávání, se Google opět vrací na scénu rozšířené a smíšené reality s novou platformou Android XR, jejíž příchod byl naznačen už na sklonku minulého roku. Přislíbena je spolupráce se společnostmi jako Samsung a Vivo na vývoji nových XR headsetů, které budou využívat sílu AI pro vylepšenou interakci a uživatelský zážitek.
Android XR byl prezentován na brýlích značek, které přislíbily spolupráci. Zmíněné byly Gentle Monster a Warby Parker. Slouží jako normální brýle, ale do popředí přidává průhledná tlačítka a prvky, které jsou v tu chvíli zrovna potřeba. Vnímají, co viděly a je možné se třeba dotázat na některé ze situací, které proběhly. Zajímavé je decentní zobrazení mapy pro intuitivní navigaci.
Na akci Google prezentoval simultánní překlad. Osoby se spolu baví ve svých rodných jazycích, brýle překládají. S určitými mezerami (jsme teprve na začátku) se toto nechá již normálně použít. Tedy za předpokladu, že i druhá strana má brýle nasazené.
Google I/O 2025 ukazuje směr, kterým se společnost ubírá – hlubší integrace umělé inteligence do všech aspektů digitálního života uživatelů. Od mobilních zařízení přes chytré hodinky až po rozšířenou realitu, AI se stává nedílnou součástí ekosystému Google. Konference slibuje další inovace a posun v oblasti technologií, které formují budoucnost digitálního světa.
Google si pro umělou inteligenci vyhradil celé dvě hodiny prezentace Google I/O 2024 a jak můžeme vidět, novinek zdaleka nebylo málo. Byť se do AI závodu Google pořádně připojil až minulý rok, díky obrovským prostředkům je schopen stále posunovat hranice a nám nezbývá než čekat, kam se umělá inteligence posune dále.
Google Mobilní telefony• Autor: Matěj Toul
Společnost Google již tradičně předvedla své technologické novinky na prezentaci Google I/O 2024. Letos na to však šla trochu jinak. Nový Google Pixel 8a výrobce ukázal již před týdnem, představení nadcházejícího Androidu 15 naopak nechal na později. Proč? Aby se mohla celá prezentace věnovat umělé inteligenci. Jak bylo zmíněno na jejím konci, slovo „AI“ za necelé dvě hodiny I/O zaznělo přesně 121× a novinek je opravdu spousta. Pojďme se podívat na ty nejzajímavější.
Pokud si chcete z Google I/O 2024 odnést jednu věc, která umělou inteligenci posunula o obrovský kus dále, bude to Project Astra. Potom, co organizace OpenAI den před I/O oznámila svého AI asistenta s odpověďmi v reálném čase, který navíc dokáže „vidět“ skrze kameru telefonu, to vypadalo, že Google bude mít hodně co dělat, aby se konkurenci přiblížil. Internetová jednička však byla více než připravená se svou odpovědí.
Project Astra je praktickou a dle videa níže velice praktickou implementací AI modelu coby osobního asistenta, který dokáže v reálném čase odpovídat a zpracovávat video vstup. Google ve svém demu ukázal mimo jiné skvělou schopnost asistenta pracovat s kontextem, pamatovat si zdánlivě nerelevantní věci z kousku videa (např. kde jste nechali ležet svoje brýle), a to všechno nejen v telefonu, ale také v chytrých brýlích. Demo video níže mluví za vše.
Project Astra by měl eventuálně nahradit klasického Asistenta Google v telefonech s operačním systémem Android. Byť Google zatím nic přímo neřekl, tato změna by měla přijít ještě do konce roku a mohla by být jedním z hlavních taháků nadcházejícího Androidu 15, o kterém se máme v následujících dnech dozvědět více.
O Google Gemini jsme již v minulosti slyšeli. Jde o aktuálně nejvíce používaný AI produkt společnosti Google a o přímou konkurenci nástrojů jako ChatGPT od OpenAI nebo Microsoft Copilot ve vyhledávači Bing. Jednou z hlavních vlastností tohoto modelu je multimodálnost v základu – Gemini byl již od začátku navržen jako nástroj pro zpracování nebo generování textu, obrázků, videa, kódu atd., zatímco jiné modely byly o tyto funkce obohaceny až s postupem času a často je u nich stále generován text jako mezikrok.
V čem má ale Google Gemini v současnosti oproti konkurenci opravdu výrazně náskok, je velikost tzv. „kontextového okna“. To si můžete představit jako množství vámi zadaných informací, nad kterými dokáže umělá inteligence v jeden moment uvažovat. V současnosti dokáže nejvyšší model Google Gemini 1.5 Pro konzistentně uvažovat nad až 1 milionem tokenů. To je zhruba 10 hodin audia, 1 hodina videa, nebo 700 tisíc slov textu. Google představil svoje plány rozšířit kontextové okno na 2 miliony tokenů do konce roku 2024.
Chat verze modelu Gemini navíc nově bude podporovat přednastavená chatová okna, podobně jako jsme již viděli u konkurence. Google tuto funkci pojmenoval Gemini Gems. Bude možné si například vytvořit Gem osobního kuchaře, kterému nastavíte popisek, o kterém bude při každém spuštění uvažovat. Ukazuje se totiž, že když chatu vštípíte, že je michelinským kuchařem s léty zkušeností, jeho výstup může být opravdu o něco málo lepší. Do popisu můžete přidat například i styl odpovídání, který vyžadujete. Všechny odpovědi se pak budou držet vámi daného formátu.
Doposud nejlepším z modelů rodiny Gemini byl Google Gemini 1.5 Pro. Na této skutečnosti se nic nemění, Google však představil novou alternativu v podobě Gemini 1.5 Flash. Jde o odlehčený model, který má poskytovat co nejrychlejší odpovědi. Má všechny výsady Gemini, tedy multimodálnost i dlouhé kontextové okno, odpovědi však obecně budou o něco méně kvalitnější než s modelem Pro.
Hlavním využitím modelu Gemini 1.5 Flash budou aplikace, které pracují s obrovským množstvím spíše jednodušších požadavků, které je potřeba co nejrychleji odbavit. Pokud vyžadujete propracované detailní výstupy a nevadí vám počkat si trochu déle, Google stále doporučuje variantu Pro.
Velmi zajímavě jsou modely také naceněny. Budete-li je používat mimo aplikace Google, tedy ve formě API (programátorského rozhraní, díky kterému lze AI integrovat do různých aplikací třetích stran), 1 milion tokenů dotazů v Gemini 1.5 Pro vás vyjde na 7 dolarů (asi 160 Kč). Pokud budou vaše jednotlivé dotazy menší než 128 tisíc tokenů, cena bude ještě nižší, zaplatíte 3,5 dolaru (asi 80 Kč) za milion tokenů dotazů. Opravdu cenově lukrativní nabídkou je ale Gemini 1.5 Flash. Ceny za používání tohoto modelu začínají na pouhých 35 centech (asi 8 Kč) za 1 milion tokenů dotazů.
Pro srovnání model GPT-4 Turbo od OpenAI, podporující maximálně 128 tisíc tokenů najednou, vás vyjde na 10 dolarů (asi 230 Kč) za milion tokenů dotazů.
Velká část prezentace byla věnována také generativní umělé inteligenci. Představil se model pro generování videa z textu Veo, vylepšený model pro generování obrázku z textu Imagen 3 a v neposlední řadě i sada nástrojů pro generování AI hudby Music AI Sandbox.
Nový model Veo je schopný generovat videa v rozlišení Full HD, v různých stylech, trvající déle než jednu minutu. Model Imagen 3 se pak zaměřuje hlavně na detaily. Dokáže věrně zobrazit i ty nejkonkrétnější požadavky a produkovat skutečně fotorealistické snímky. Výstupy v tomto případě nemá smysl popisovat slovy – podívejte se na demo videu níže.
Vše, co Gemini vygeneruje (nově včetně videí), bude opatřeno neměnným „vodoznakem“ SynthID ve snaze zabránit šíření falešných informací a vydávání generovaného obsahu za autorský.
Google krátce promluvil také o své rodině otevřených modelů Gemma, které může volně využívat kdokoliv. Model PaliGemma například slouží k rozpoznávání obrazu pro účely přístupnosti, CodeGemma je pak specificky trénován na pomoc při programování. Google představil také nový otevřený model pro obecné využití, Gemma 2, o kterém se prý více dozvíme v nadcházejících týdnech.
i
Motorola Edge 50 Pro (RECENZE): Unikát s perfektním displejem, který umí fotit a rychle ho nabijete
Testování Google Gemini v rámci vyhledávání Google probíhá již nějakou dobu. Na Google I/O 2024 jsme dostali náhled toho, co všechno AI při vyhledávání dovede. Mezi klíčové funkce patří shrnutí – Gemini pospojuje informace z vyhledaných článků a vám dá krátký a přehledný výsledek, přičemž připojí všechny zdroje, pokud se chcete dozvědět více.
Vyhledávání je také schopné pojmout složitější požadavky. Na prezentaci byl ukázán dotaz „najdi nejlepší jóga nebo pilates studio v Bostonu, ukaž mi detaily o nabídkách pro začátečníky a pěší vzdálenost od Beacon Hill“. Google Gemini si dokáže požadavek rozdělit na kroky, všechny požadované informace získat, a nakonec vám je uceleně prezentovat v přehledném blokovém rozhraní přizpůsobeném tomu, co zrovna hledáte.
Vyhledávání bude navíc opět multimodální – k již existujícímu vyhledávání textem, hlasem a obrázky přibude také video (pravděpodobně na bázi Project Astra).
Google oznámil, že po dlouhém testování jsou připraveni umělou inteligenci ve vyhledávání uvolnit veřejně. Ještě tento týden by se funkce měla objevit uživatelům v USA, o zbytku světa zaznělo jen netečné „brzy“.
Další využití pro Gemini našel Google v prostředí Google Workspace. Jde o firemní balíček oblíbených produktů jako Gmail, Disk Google, Kalendář Google, Dokumenty Google a další – v jedné aplikaci, s přidanými funkcemi. Google Gemini zde bude možné přidat jako nového „kolegu“. Potřebujete uspořádat faktury z emailů do jednoho místa? Pro Gemini to není problém a při té příležitosti vám vytvoří tabulku příjmů a výdajů, kterou doplní o relevantní grafy.
Gemini můžete dále používat i ve skupinových chatech stejně tak, jako byste si psali s kolegy. Chcete se ujistit, že je nová verze vašeho produktu připravena k vydání? Stačí se zeptat, a pokud se nikdo z vašich skutečných kolegů nebude mít k odpovědi, Gemini projde všechny soubory a data, ke kterým má přístup, vytkne potenciální problémy a navrhne vám další postup.
Na výstup Gemini pak klidně může reagovat další z kolegů například zadáním náročného úkolu, který by běžně zabral hodiny. Gemini bude za pár minut zpět s výstupním souborem.
Gemini jako kolega v Google Workspace zní skvěle, ale přece jen je to nástroj ryze profesionální, který nejspíš většina uživatelů nevyužije. Google ale chce umělou inteligenci přinést opravdu všem. Představují se proto tzv. AI Agenti. V podstatě jde o velmi pokročilé spojení všeho, co Google AI nabízí. Zadaný úkol si agent rozplánuje do několika kroků a dokáže pracovat napříč různým softwarem.
Na Google I/O 2024 jsme viděli velmi častou situaci. Koupili jste si boty, ale velikost vám nesedí – stačí zadat jeden příkaz AI agentovi. Ten pak projde vaše emaily a najde fakturu, zjistí, kde jste boty zakoupili a všechny informace důležité pro vrácení, vyplní reklamační formulář a vám jen řekne, kam máte boty přinést, nebo dokonce objedná svoz.
Nad všemi těmito kroky byste přitom měli kontrolu – AI agent všechno naplánuje a udělá za vás, ale než udělá něco, co byste možná nemuseli chtít, vždy se vás zeptá na potvrzení. Na prezentaci několikrát zaznělo, že mít kontrolu nad celým procesem je jedna z nejvyšších priorit. Google však upozorňuje, že tato technologie je stále v raném vývoji, a na první veřejné testy si tak určitě ještě pár měsíců, ne-li déle, počkáme.
Požadavky na hardware schopný bleskových výpočtů pro umělou inteligenci se v posledních letech exponenciálně zvyšuje a, zdá se, nemá konce. Google proto představil svou novou řadu TPU (tensor processing unit, speciální čipy pro urychlení tenzorových výpočtů, používaných v AI) zvanou Trillium. Ta má být 4,7× výkonnější než předchozí generace. Čipy budou dostupné uživatelům platformy Google Cloud ke konci roku 2024. Vlastní fyzické verze TPU čipů v minulosti k dispozici nebyly a Google zatím neukázal žádné plány tuto skutečnost měnit.
Google si pro umělou inteligenci vyhradil celé dvě hodiny prezentace Google I/O 2024 a jak můžeme vidět, novinek zdaleka nebylo málo. Byť se do AI závodu Google pořádně připojil až minulý rok, díky obrovským prostředkům je schopen stále posunovat hranice a nám nezbývá než čekat, kam se umělá inteligence posune dále.
Google Mobilní telefonyLetošní úvodní keynote na Google I/O se nesla ve znamení umělé inteligence. Kromě té se však firma nezdráhala představit i nějaký ten hardware. Na co hlavního se Google zaměřil?
Umělá inteligence hraje velkou roli v našich životech a bude se integrovat ještě daleko více téměř do všeho, co známe. Proto se zkratka AI v úvodu konference objevovala často.
Google s její pomocí vylepší své služby. Funkce Help me write v Gmailu dovolí napsat vstupní příkaz (tzv. prompt) a Gamil napíše email za vás. Google mapy zvládnou trojrozměrně projet vámi naplánovanou trasu. Do záběru přidá i auta či ptáky na obloze.
Umělá inteligence je velmi používána v oblasti fotografií. Není tedy nic překvapivého, že nové funkce přijdou i do Google Photos. V Magic Editoru například posunete do středu záběru objekt, který se ztrácí v krajích. Editor sám zbytek fotky dopočítá a upraví i světelnost, aby byl výsledek reálný. Google se neomezuje pouze na email, mapy a fotky. Dal si závazek využít AI k věcem prospěšným společnosti.
i
Shrnutí keynote v angličtině si můžete přečíst od samotného CEO na blogu Google.
PaLM 2 je další generace rozsáhlého jazykového modelu. Půjde o pohon služby Google Bard, tedy chatbota konkurujícího třeba světoznámému ChatGPT. PaLM 2 zvládne ladit chyby v programovacích jazycích. Byl trénován hned na dvacítce takových jazyků. V rámci otázek z oblasti zdravotnictví si model dokázal poradit natolik, že dosáhl úrovně experta. Google si uvědomuje, že výsledky AI je třeba identifikovat, proto přináší ochranu v podobě vodoznaků a integrovaných metadat. AI se dostane i do vyhledávání a mobilního systému Android.
Operační systém Googlu přichází již ve své 14. verzi. Více než 50 Google aplikací bylo uzpůsobeno čím dál větším úhlopříčkám telefonů i tabletů, například Spotify, Minecraft či Disney+. Bude uzpůsoben i právě novému tabletu Google Pixel Fold. Novinky se týkají i Wear OS, systému pro hodinky Google Pixel Watch a Samsung Galaxy Watch. Do systému nově přibyde aplikace WhatsApp. Změn se dočká i Gmail a kalendář.
Android může čerpat z obrovské základny zařízení. To však může působit jejich roztříštěnost, proto Google v Androidu 14 myslí na jejich lepší propojení. Třeba Fast Pair zrychlí proces párování příslušenství typu bezdrátová sluchátka. Pokud jste poblíž jiného podporovaného zařízení, můžete s ním okamžitě sdílet soubory, a funguje i mezi Chromebookem, telefonem a tabletem. Aplikace Find My Device udržuje geografický dohled nad spoustou vašich produktů i od výrobců třetích stran.
Opět se dostáváme k AI. Android 14 sám předepíše zprávu jako odpověď na konverzaci v chatu, a to v několika variantách. Z obrázku na ploše vyřízne objekt v popředí a nechá ho vtáhnout do rozmazaného pozadí. Další wallpapery můžete generovat právě díky umělé inteligenci. A bude se jednat o unikáty, které doposud nikdo jiný na ploše svého telefonu nikdy neměl. Do telefonů také přichází standard RCS. Má jít o moderní způsob komunikace nahrazující SMS a MMS, jak je známe.
Novým hardwarem se stal telefon Google Pixel 7a. Má jít o nástupce Google Pixelu 6a a spadá pod smartphonovou střední třídu. Svým vzhledem i funkcí se velmi podobá aktuálnímu Google Pixelu 7, má však jít o jeho odlehčenou variantu.
Zprvu si rozdílu všimnout téměř nemusíte, ovšem novinka má menší displej o úhlopříčce 6,1" a okolo něj je viditelný tlustší černý rámeček. Zadní stranu si s Pixelem 7 spletete velmi snadno. Snad jen modrá verze značí, že jde právě o nejnovější Pixel 7a.
Telefon se dražšímu bratříčkovi může vyrovnat svým výkonem díky přítomnosti procesoru Google Tensor G2 a 8 GB operační paměti. Novinkou, kterou jistě potěší a zároveň stoupne jeho pomyslná hodnota, je určitě podpora bezdrátového nabíjení. Google Pixel 7a také šlápl do pedálů a nenechá se zahanbit ani svými fotoaparáty. Těm narostl počet pixelů.
Spekulace nelhaly. Google se nově pochlubil svým vlastním ohebným smartphonem. Vstupuje tak na trh, kterému vévodí zejména řada Samsung Galaxy Z. Google Pixel Fold není skromný a dle výrobce má obsahovat tu nejlepší fotografickou zkušenost mezi ohebnými telefony. A že má třeba v Samsungu Galaxy Z Fold4 velkou konkurenci. Oproti korejskému modelu působí jako zavalitější mobil prémiových materiálů, který skrývá vysoký výkon a 7,6" displej.
Google Pixel tablet s 11" displejem je přímo zaměřen na konzumaci obsahu, čímž se Google nijak netají. Také on se spoléhá na Google Tensor G2 procesor. Jeho nabíjecí základna slouží dále jako stojánek, ale také reproduktor. Tablet je tedy nejen díky tomu užitečný jako domácí asistent a zábavní prvek v jednom. Úzká spolupráce s Pixel telefony a Google službami jako Google Photos se přímo vybízí.
V umělé inteligenci vidí Google budoucnost, ale již se snaží proniknout do jejích tajů v současnosti. Představené služby a produkty jsou toho jednoznačným důkazem. Google představil své plány a my už se těšíme na oznámení nových vlajkových smartphonů pro tento rok.