• Autor: Ondřej Chabr
Umělá inteligence Google Gemini nám již nyní poskytne např. přes mobilní telefon cenné informace, které lze využít pro velkou škálu úkonů. Nově se ale možnost interakce s Gemini ještě více přiblížila klasické mezilidské komunikaci. To přináší funkce Gemini Live. Co to je, kde novou funkci spustíme a v čem nám může pomoci?
Gemini Live je k dispozici v rámci funkce Gemini Live Camera & Screen Sharing, tedy funkce, vycházející z dřívějšího projektu Project Astra. S uživateli komunikuje v reálném čase pomocí hlasu, a to na základě toho, co vidí přes fotoaparát, nebo toho, co uvidí, když jí nasdílíte obsah své obrazovky.
Namiřte fotoaparátem svého mobilu například na nějaký předmět a o něm si můžete s umělou inteligencí v reálném čase povídat. Snadno se tak třeba dozvíte, kolik zhruba stojí a jaké jsou parametry auta, které vás na ulici zaujalo. Poví vám, co je onen neznámý doplněk do domácnosti u známého, kde se dá koupit i kolik stojí.
Umělá inteligence v Gemini Live vám podá informace i o dalších předmětech či objektech a zvládne také poradit s výběrem oblečení nebo zjišťovat informace o přírodě kolem vás.
Rady od AI v Gemini Live přijdou vhod i při řešení mnoha problémů, třeba technických. Stačí telefonem ukazovat, kde je nějaký problém a doptávat se. Podle toho, co vidí, by mělo Gemini Live zvládat odpovídat a instruovat. Své znalosti pak samozřejmě získává na základě čerpání dostupných dat a informací z různých webů.
Podobnou konverzaci pak můžete vést i na základě toho, co máte na obrazovce svého telefonu, například když potřebujete vyřešit nějaký problém.
Nemáte-li rádi procházení různých návodů, poskytněte ho službě Gemini pouhým jeho nahráním ve formátu PDF. Google Gemini Live už vás může navigovat dle informací, které získá právě rychlým přečtením daného souboru.
Komunikovat jde také o videu. Asistent vysvětlí, co se v obrazu děje nebo dokáže modifikovat informace, pokud změníte vstupy. Třeba video o přípravě jídla pro 2 osoby vám Gemini Live pomůže změnit na recept pro dvojnásobný počet lidí.
Jistě znáte funkci Circle to Search, Gemini Live je ale intuitivnější v tom, že s ní můžete o výsledku diskutovat a ptát se na další doplňující otázky. To vše navíc v českém jazyce, protože Gemini Live podporuje více než 45 jazyků a naše mateřština mezi nimi naštěstí nechybí.
Když tedy budete například sedět v cizině v restauraci, můžete se rázem velmi snadno zorientovat v jejich nabídce jídelního lístku, a dostat doporučení na to, co by vám mohlo chutnat nejvíce. Může ale třeba i suplovat průvodce v muzeu. Následující ukázka je všeříkající.
Jak jsme si již řekli, funkce Gemini Live je dostupná uživatelům placené verze Gemini Advanced. Časem se přesune i do Gemini Basic, ovšem zatím jen na telefonech řady Google Pixel 9 a Samsung Galaxy S25. Vyvolání funkce Gemini Live je jednoduché. Stačí spustit asistenta podržením zapínacího tlačítka a následně kliknout na 3 tečky vedle ikonky mikrofonu.
Gemini Live představuje další zajímavý krok v oblasti umělé inteligence a její integrace do každodenního života. Může se stát společníkem, který se bude hodit většině z nás, protože tato funkce umožňuje uživatelům komunikovat s AI v reálném čase a konzultovat s ní množství témat. Ať už jde o hledání inspirace, řešení problémů nebo získávání praktických rad.
Mobilní telefony
• Autor: Peter Vnuk
Google představil v březnu 2025 novou verzi své umělé inteligence Gemini 2.5, která přináší řadu vylepšení zaměřených na lepší porozumění jazyku a vizuálním datům. Nová verze se vyznačuje zvýšenou schopností rozpoznávat nuance v jazyce, rychlejším zpracováním dat a pokročilejšími funkcemi pro identifikaci objektů v obrazech. Díky tomu má nová verze AI od Googlu být výkonnějším nástrojem pro různé aplikace, od chatbotů a hlasových asistentů až po průmyslové využití a vývoj webových aplikací
Google v březnu 2025 představil novou verzi své AI Gemini 2.5, která přináší významná vylepšení v oblasti zpracování přirozeného jazyka a vizuálních dat. Aktualizace se zaměřuje na lepší porozumění kontextu a přesnější identifikaci objektů v obrazech.
Gemini 2.5 se pyšní především zesílením schopnosti rozpoznávat nuance přirozeného jazyka. Díky tomu je model schopen lépe pochopit kontext a významy slov i v komplikovanějších textech. Novinka je navržena jako „myšlenkový model“, což znamená, že dokáže přemýšlet před odpovědí, čímž se zlepšuje přesnost a logika výstupu. To je užitečné zejména v aplikacích, které vyžadují hlubokou jazykovou analýzu, například v chatbotových službách nebo při automatizovaném zpracování dokumentů.
Zároveň byla výrazně optimalizována rychlost zpracování. Google se soustředil na zkrácení odezvy modelu, což je klíčové při využití v reálném čase, například v asistentech nebo aplikacích pro monitorování obrazu.
Výrazným posunem je vylepšení schopnosti zpracovávat vizuální data. Gemini 2.5 dokáže přesněji identifikovat objekty a pracuje lépe s detailními obrazovými informacemi. Model obsahuje kontextové okno o velikosti 1 milionu tokenů s plánovaným rozšířením na 2 miliony, což umožňuje efektivnější práci s rozsáhlými datovými soubory. Tato vlastnost je cenná při aplikacích využívajících vizuální analýzu, jako je rozpoznávání obličejů nebo sledování průmyslových procesů.
Google rovněž integroval do modelu nové algoritmy pro rychlejší analýzu obrazů, což zlepšuje výkon při práci s videem nebo velkými obrazovými databázemi.
Gemini 2.5 nabízí nové rozhraní pro vývojáře, které umožňuje snadnější integraci s dalšími službami Google. Vývojáři mohou využít pokročilé nástroje pro práci s přirozeným jazykem a obrazy přímo ve svých aplikacích. Zlepšená dokumentace a podpora výrazně usnadňují implementaci nových funkcí do různých projektů.
Verze 2.5 Pro Experimental má být nejpokročilejším modelem pro složité úkoly a vede na žebříčku LMArena, což ukazuje na její špičkové schopnosti v oblasti logického uvažování a kódování. Také je to v podstatě důkaz, že Google svá tvrzení o pokročilosti modelu Pro Experimental nepřehání.
Výrobce také plánuje rozšířit využití Gemini 2.5 v rámci své cloudové platformy, čímž nabídne robustnější a výkonnější řešení pro firmy, které potřebují zpracovávat velké množství dat v reálném čase.
Díky novým schopnostem je možné využít Gemini 2.5 například při tvorbě interaktivních hlasových asistentů, kde je kladen důraz na přirozenost konverzace a schopnost reagovat na změny kontextu. Dále lze model nasadit v průmyslových aplikacích, kde je nutné rychle a přesně analyzovat vizuální data.
Novinka také výrazně vylepšuje kodérské schopnosti, zejména při tvorbě vizuálně atraktivních webových aplikací a agentních kódovacích aplikací, přičemž na benchmarku SWE-Bench Verified dosahuje 63,8 % (zdroj: Google).
Model Gemini 2.5 naznačuje, že firma plánuje rozvíjet umělou inteligenci tak, aby byla co nejvíce přizpůsobena praktickým potřebám uživatelů, ale zároveň chce oslovit i firmy a vývojáře s cílem pokrýt celý trh s AI.
• Autor: Ondřej Chabr
Google představil novou generaci AI, Gemini 2.0, počínaje verzí Flash, která se výkonem vyrovná předchozí verzi 1.5 Pro. Tato generace je označována jako „agentní“ AI, schopná plnit zadané úkoly, přičemž součástí této verze je Project Astra – asistent například pro praktické úkony jako konverzace nebo používání nástrojů.
Google představuje novou generaci své AI - Google Gemini 2.0. Předchozí generaci označoval jako 1.5, přičemž nová 2.0 vychází aktuálně pouze ve „slabší“ verzi nazvané 2.0 Flash. I tak je tato na zhruba stejné úrovni jako současný model Pro. Gemini 2.0 Flash je nyní dostupný pro vývojáře a testery.
Novinkou Google Gemini 2.0 je třeba nativní výstup audiovizuální ve formě obrázků a hudebních souborů s tím, že expanze se čeká již zkraje roku 2025. Google o nové generaci hovoří jako o „agentní“ AI. Oním agentem je myšleno to, že systém umělé inteligence je jako robot, který plní zadané úkoly.
V rámci Gemini 2.0 se do popředí dostává asistent Project Astra. Zaměřuje se na čistě praktické úkony. Zvládne třeba konverzovat v několika jazycích s podporou akcentu. Také umí používat nástroje, má přístup k mapám, vyhledávači i vizuálnímu hledání Google Lens.
V praxi funguje například tak, že telefonem namíříte na nějaký objekt, například na umělecké výstavě, a zeptáte se mobilu, co ví o onom objektu. Telefon následně odpoví. Ukázku můžete vidět ve videu výše.
Pro plynulou a přirozenější komunikaci taky Astra zapracovala na paměti, kdy si dokáže držet v povědomí posledních 10 minut konverzace. Mimo aplikaci Gemini by Google rád Astru integroval i do chytrých brýlí. Tam bude mít především vizuální vyhledávání potenciál asi největší.
Dalším agentem je Project Mariner. Řeší komplexnější úkoly s tím, že postupuje krok po kroku s využitím nástrojů Google, především vyhledávačem. Vývojáře pak zase zaujme Jules. Ten se integruje přímo do workflow GitHubu. Pod dohledem vývojáře pak pomůže s řešením problému, plánuje postup a provádí jej.
Překvapivě se další agent zabývá hraním her. Pomáhá orientovat se v hratelných virtuálních světech. Radí na základě toho, co vidí na obrazovce.
• Autor: Peter Vnuk
Umělá inteligence (AI) je aktuálně největší trend technologického světa a potkávat ji budeme všude mnohem častěji, než jsme zvyklí. Její generativní druh započal svou velkou cestu do zařízení, jako jsou mobilní telefony, tablety, počítače nebo nositelná zařízení, hlavně díky ChatGPT. Google však přichází s modelem Gemini, který by mohl ChatGPT natrhnout triko a o kterém se v poslední době hodně mluví. Čím se Gemini liší a co vše umí?
Rok 2023 byl rokem generativní umělé inteligence (AI). Široká veřejnost se začala zajímat o toto odvětví hlavně díky chatbotu ChatGPT od společnosti OpenAI, ve které měl kdysi svůj podíl i Elon Musk. Propracované a užitečné odpovědi ChatGPT měly úspěch a bylo otázkou času, kdy na tohoto nového a rychlého koně usedne i konkurence.
Jednou z nich je Bing AI, který se přejmenoval na Copilot a Microsoft ho aktuálně integruje do Windows 11. Kartami ale míchá i samotná společnost Google, která svého chatbota Bard poháněného modelem LaMDA přejmenovala na Gemini a dala mu nové jádro.
Model je trénován na obrovském množství dat, a tak dokáže odpovídat na otázky z oblastí jako věda, literatura, aktuální události ve světě, politika či historie. Právě přístup k aktuálním informacím z internetu je výhoda Gemini, kterou mnohá konkurence nemá. Například ChatGPT se omezuje na informace před lednem 2022.
V praxi je podstatné, že generativní AI mění pravidla hry. Do rukou běžného člověka se dostává silný nástroj, který dokáže například na fotografii odstranit vrásky na vašem čele, zmenšit výrazně rušivý prvek nebo vizuálně odstranit osobu, která na záběru nemá co dělat.
Generativní AI totiž dokáže díky tréninku na množství dat zamaskovat změny, a proto již nemusíte ovládat žádné „photoshopy“. Stačí po daném místě projet prstem či dotykovým perem. Telefon si většinu věcí domyslí, takže je to jednoduché, rychlé a zvládne to každý. Tím však výhody ani zdaleka nekončí.
Součástí modelů jako Google Gemini je také možnost kreativní konverzace s chatbotem. Může podle vašeho zadání napsat báseň či esej, poradí vám s upravením jídelníčku, abyste si zlepšili nabírání svalů či snižování hmotnosti, nebo si s vámi jednoduše promluví na jakékoliv téma prakticky na úrovni člověka.
Úplně přirozeným jazykem s vámi Google Gemini probere například politickou situaci ve Venezuele. Vysvětlí vám, proč je v noci tma, přeloží článek v cizím jazyce nebo poradí, jak investovat do bitcoinu co nejbezpečněji.
Google vyvinul model Gemini jako multimodální, což znamená, že jeho schopnosti nekončí při kreativním či jiném rozhovoru. Má předpoklady pomoci svému uživateli i s programováním software nebo generováním a úpravou videí, zvukových záznamů či obrázků. V této chvíli ještě jeho úplný potenciál není veřejnosti přístupný, zatím pracuje s textem a informacemi, ale pravděpodobně se to změní v průběhu několika měsíců. Google přitom tvrdí, že Gemini je ve více než 50 testovaných oblastech schopností na úrovni lidských expertů.
Aktuálně nabízejí firmy stojící za AI, jako je Google Gemini, vždy dvě alternativy. Placení chatboti jsou vždy mnohem sofistikovanější. Mají přístup k většímu množství informací, jsou kreativnější, méně omezují počet odpovědí, které měsíčně můžete dostat, a mají hromadu dalších výhod.
Ale je třeba zdůraznit, že bezplatná verze Gemini, která je dostupná pro každého, dokáže už nyní množství věcí, jež budou určitě nejednomu uživateli stačit. Kromě konverzace na různá témata zvládne bezplatná varianta i kreativní generování textu či jazykové překlady. Ve chvíli vzniku tohoto článku je k dispozici právě jen bezplatná verze, přičemž Google zdůrazňuje, že Gemini je celkově ve verzi beta a verze Pro (někde se uvádí i jako Advanced) a Enterprise nejsou přístupné široké veřejnosti.
V názvosloví placených verzí Gemini vládne tak trochu chaos a nic není jisté a jasné. Google aktuálně vyhodnocuje data z testování a registrace do placených verzí beta není možná. Jejich výhody a ceny však známe už nyní. Varianta Pro by měla nabídnout úplnou verzi Gemini za přibližně 1 200 Kč měsíčně s omezením na 100 tisíc odpovědí. Ta bezplatná se omezuje na 500 odpovědí měsíčně.
Pro podnikovou sféru je tu i varianta Enterprise, který má přinášet rychlejší reakce, výhody v oblasti podpory Google, mnohem vyšší počet odpovědí a přiděleného manažera účtu. Cena takového předplatného je však na vyžádání a odhaduje se nad 230 tisíc Kč měsíčně, takže bude zajímavá skutečně jen pro omezený počet specifických zákazníků.
Google pracuje na začlenění Gemini i do svého portfolia aplikací a služeb jako Gmail nebo Mapy. Takže AI, která bude mít přístup k e-mailovým zprávám a dalším personalizovaným informacím, bude schopná lépe pomáhat jednotlivcům i firmám například s optimalizací výdajů či v oblasti zdraví.
Je jasné, že v roce 2024 se trend generativní AI bude zesilovat a postupně se bude tato technologie usazovat v mobilních telefonech. Prvními představiteli jsou členové nové generace smartphonů Galaxy S24 od Samsungu a již v této chvíli je jisté, že i nový iPhone 16 a iOS 18 budou plné nových prvků, které AI s sebou přináší. Karty však může velmi výrazně zamíchat umělá inteligence Gemini od Google.
Je třeba říci, že nejde o žádné marketingové triky. Umělá inteligence dokáže skutečně vylepšit běžné používání mobilu například rozpoznáním a vyhledáním objektů na fotografii. Google má s jeho Gemini tu výhodu, že operační systém Android běží na miliardách chytrých telefonů po celém světě.
Když začne vyměňovat postaršího Asistenta Google za nového s jádrem Gemini, Samsung s jeho Galaxy AI či Apple s novou vylepšenou Siri budou mít velmi silnou konkurenci. A tento proces už začal, i když oficiálně pouze ve Spojených státech amerických. U nás je možné vyměnit Asistenta Google za Gemini zatím pouze aplikací z neoficiálních zdrojů.
Oficiálně je apka pouze v angličtině, ale ve skutečnosti podporuje Gemini češtinu i slovenštinu a dokáže v ní bez problémů komunikovat. To mu dává předpoklady nahradit Asistenta Google plnohodnotně i v našich končinách. Je to jenom otázka času.