Namiřte fotoaparátem na předmět a AI vám řekne, co to je. Google Gemini Live spustíme i u nás a česky

Aktualizováno: 10. dubna 2025 • Autor: Ondřej Chabr

Umělá inteligence Google Gemini nám již nyní poskytne např. přes mobilní telefon cenné informace, které lze využít pro velkou škálu úkonů. Nově se ale možnost interakce s Gemini ještě více přiblížila klasické mezilidské komunikaci. To přináší funkce Gemini Live. Co to je, kde novou funkci spustíme a v čem nám může pomoci?

Google Gemini Live

Google Gemini Live – OBSAH

Jak funguje Gemini Live
Gemini Live podporuje češtinu
Gemini Live je možné si vyzkoušet na těchto telefonech
Google představil AI model Gemini 2.5. Uvažuje hlouběji a lépe rozumí obrazu
Google představil AI model Gemini 2.0. Má asistenty, kteří pomůžou i v běžném životě
Google Gemini je novou velkou rybou v moři umělé inteligence

Jak funguje Gemini Live

Gemini Live je k dispozici v rámci funkce Gemini Live Camera & Screen Sharing, tedy funkce, vycházející z dřívějšího projektu Project Astra. S uživateli komunikuje v reálném čase pomocí hlasu, a to na základě toho, co vidí přes fotoaparát, nebo toho, co uvidí, když jí nasdílíte obsah své obrazovky.

Namiřte fotoaparátem svého mobilu například na nějaký předmět a o něm si můžete s umělou inteligencí v reálném čase povídat. Snadno se tak třeba dozvíte, kolik zhruba stojí a jaké jsou parametry auta, které vás na ulici zaujalo. Poví vám, co je onen neznámý doplněk do domácnosti u známého, kde se dá koupit i kolik stojí.

Umělá inteligence v Gemini Live vám podá informace i o dalších předmětech či objektech a zvládne také poradit s výběrem oblečení nebo zjišťovat informace o přírodě kolem vás.

Rady od AI v Gemini Live přijdou vhod i při řešení mnoha problémů, třeba technických. Stačí telefonem ukazovat, kde je nějaký problém a doptávat se. Podle toho, co vidí, by mělo Gemini Live zvládat odpovídat a instruovat. Své znalosti pak samozřejmě získává na základě čerpání dostupných dat a informací z různých webů.

Podobnou konverzaci pak můžete vést i na základě toho, co máte na obrazovce svého telefonu, například když potřebujete vyřešit nějaký problém.

Nemáte-li rádi procházení různých návodů, poskytněte ho službě Gemini pouhým jeho nahráním ve formátu PDF. Google Gemini Live už vás může navigovat dle informací, které získá právě rychlým přečtením daného souboru.

Komunikovat jde také o videu. Asistent vysvětlí, co se v obrazu děje nebo dokáže modifikovat informace, pokud změníte vstupy. Třeba video o přípravě jídla pro 2 osoby vám Gemini Live pomůže změnit na recept pro dvojnásobný počet lidí.

Gemini Live podporuje češtinu

Jistě znáte funkci Circle to Search, Gemini Live je ale intuitivnější v tom, že s ní můžete o výsledku diskutovat a ptát se na další doplňující otázky. To vše navíc v českém jazyce, protože Gemini Live podporuje více než 45 jazyků a naše mateřština mezi nimi naštěstí nechybí.

Apple vydal iOS 18.4. Apple Intelligence si užijeme už i u nás, je tu však jedno ale

Když tedy budete například sedět v cizině v restauraci, můžete se rázem velmi snadno zorientovat v jejich nabídce jídelního lístku, a dostat doporučení na to, co by vám mohlo chutnat nejvíce. Může ale třeba i suplovat průvodce v muzeu. Následující ukázka je všeříkající.

Gemini Live je možné si vyzkoušet na těchto telefonech

Jak jsme si již řekli, funkce Gemini Live je dostupná uživatelům placené verze Gemini Advanced. Časem se přesune i do Gemini Basic, ovšem zatím jen na telefonech řady Google Pixel 9 a Samsung Galaxy S25. Vyvolání funkce Gemini Live je jednoduché. Stačí spustit asistenta podržením zapínacího tlačítka a následně kliknout na 3 tečky vedle ikonky mikrofonu.

Gemini Live představuje další zajímavý krok v oblasti umělé inteligence a její integrace do každodenního života. Může se stát společníkem, který se bude hodit většině z nás, protože tato funkce umožňuje uživatelům komunikovat s AI v reálném čase a konzultovat s ní množství témat. Ať už jde o hledání inspirace, řešení problémů nebo získávání praktických rad.

Mobilní telefony

Články o starších verzích Google Gemini

Google představil AI model Gemini 2.5. Uvažuje hlouběji a lépe rozumí obrazu

Article

Aktualizováno: 3. dubna 2025 • Autor: Peter Vnuk

Google představil v březnu 2025 novou verzi své umělé inteligence Gemini 2.5, která přináší řadu vylepšení zaměřených na lepší porozumění jazyku a vizuálním datům. Nová verze se vyznačuje zvýšenou schopností rozpoznávat nuance v jazyce, rychlejším zpracováním dat a pokročilejšími funkcemi pro identifikaci objektů v obrazech. Díky tomu má nová verze AI od Googlu být výkonnějším nástrojem pro různé aplikace, od chatbotů a hlasových asistentů až po průmyslové využití a vývoj webových aplikací

Google Gemini 2.5

Google Gemini 2.5 – OBSAH

S jakými novinkami přichází nová AI Gemini 2.5 od Google?
Konkurence se rychle vyvíjí, a tak i Gemini 2.5 vylepšuje zpracování obrázků
Nové možnosti pro vývojáře a firmy, ale i rozšířená integrace do cloudu
Články o starších verzích Google Gemini

S jakými novinkami přichází nová AI Gemini 2.5 od Google?

Google v březnu 2025 představil novou verzi své AI Gemini 2.5, která přináší významná vylepšení v oblasti zpracování přirozeného jazyka a vizuálních dat. Aktualizace se zaměřuje na lepší porozumění kontextu a přesnější identifikaci objektů v obrazech.

Gemini 2.5 se pyšní především zesílením schopnosti rozpoznávat nuance přirozeného jazyka. Díky tomu je model schopen lépe pochopit kontext a významy slov i v komplikovanějších textech. Novinka je navržena jako „myšlenkový model“, což znamená, že dokáže přemýšlet před odpovědí, čímž se zlepšuje přesnost a logika výstupu. To je užitečné zejména v aplikacích, které vyžadují hlubokou jazykovou analýzu, například v chatbotových službách nebo při automatizovaném zpracování dokumentů.

Zároveň byla výrazně optimalizována rychlost zpracování. Google se soustředil na zkrácení odezvy modelu, což je klíčové při využití v reálném čase, například v asistentech nebo aplikacích pro monitorování obrazu.

Konkurence se rychle vyvíjí, a tak i Gemini 2.5 vylepšuje zpracování obrázků

Výrazným posunem je vylepšení schopnosti zpracovávat vizuální data. Gemini 2.5 dokáže přesněji identifikovat objekty a pracuje lépe s detailními obrazovými informacemi. Model obsahuje kontextové okno o velikosti 1 milionu tokenů s plánovaným rozšířením na 2 miliony, což umožňuje efektivnější práci s rozsáhlými datovými soubory. Tato vlastnost je cenná při aplikacích využívajících vizuální analýzu, jako je rozpoznávání obličejů nebo sledování průmyslových procesů.

Google Gemini 2.5 — Nový model Gemini 2.5 dominuje v oficiálních i nezávislých benchmarcích.

Google rovněž integroval do modelu nové algoritmy pro rychlejší analýzu obrazů, což zlepšuje výkon při práci s videem nebo velkými obrazovými databázemi.

Nové možnosti pro vývojáře a firmy, ale i rozšířená integrace do cloudu

Gemini 2.5 nabízí nové rozhraní pro vývojáře, které umožňuje snadnější integraci s dalšími službami Google. Vývojáři mohou využít pokročilé nástroje pro práci s přirozeným jazykem a obrazy přímo ve svých aplikacích. Zlepšená dokumentace a podpora výrazně usnadňují implementaci nových funkcí do různých projektů.

Verze 2.5 Pro Experimental má být nejpokročilejším modelem pro složité úkoly a vede na žebříčku LMArena, což ukazuje na její špičkové schopnosti v oblasti logického uvažování a kódování. Také je to v podstatě důkaz, že Google svá tvrzení o pokročilosti modelu Pro Experimental nepřehání.

Výrobce také plánuje rozšířit využití Gemini 2.5 v rámci své cloudové platformy, čímž nabídne robustnější a výkonnější řešení pro firmy, které potřebují zpracovávat velké množství dat v reálném čase.

Grok 3: Rebelský chatbot Elona Muska poháněný superklastrem Nvidia, který budí vášně

Google měl při Gemini 2.5 na paměti praktickou využitelnost

Díky novým schopnostem je možné využít Gemini 2.5 například při tvorbě interaktivních hlasových asistentů, kde je kladen důraz na přirozenost konverzace a schopnost reagovat na změny kontextu. Dále lze model nasadit v průmyslových aplikacích, kde je nutné rychle a přesně analyzovat vizuální data.

Novinka také výrazně vylepšuje kodérské schopnosti, zejména při tvorbě vizuálně atraktivních webových aplikací a agentních kódovacích aplikací, přičemž na benchmarku SWE-Bench Verified dosahuje 63,8 % (zdroj: Google).

Model Gemini 2.5 naznačuje, že firma plánuje rozvíjet umělou inteligenci tak, aby byla co nejvíce přizpůsobena praktickým potřebám uživatelů, ale zároveň chce oslovit i firmy a vývojáře s cílem pokrýt celý trh s AI.

Google představil AI model Gemini 2.0. Má asistenty, kteří pomůžou i v běžném životě

Article

Aktualizováno: 12. prosince 2024 • Autor: Ondřej Chabr

Google představil novou generaci AI, Gemini 2.0, počínaje verzí Flash, která se výkonem vyrovná předchozí verzi 1.5 Pro. Tato generace je označována jako „agentní“ AI, schopná plnit zadané úkoly, přičemž součástí této verze je Project Astra – asistent například pro praktické úkony jako konverzace nebo používání nástrojů.

Google Gemini 2.0 – OBSAH

Gemini 2.0 Flash srovnává krok s doposud nejrychlejším Gemini 1.5 Pro
Project Astra aneb Agent určený pro plnění praktických úkolů
AI Google Gemini budou moci konstruktivně využít i vývojáři

Gemini 2.0 Flash srovnává krok s doposud nejrychlejším Gemini 1.5 Pro

Google představuje novou generaci své AI - Google Gemini 2.0. Předchozí generaci označoval jako 1.5, přičemž nová 2.0 vychází aktuálně pouze ve „slabší“ verzi nazvané 2.0 Flash. I tak je tato na zhruba stejné úrovni jako současný model Pro. Gemini 2.0 Flash je nyní dostupný pro vývojáře a testery.

Project Astra aneb Agent určený pro plnění praktických úkolů

Novinkou Google Gemini 2.0 je třeba nativní výstup audiovizuální ve formě obrázků a hudebních souborů s tím, že expanze se čeká již zkraje roku 2025. Google o nové generaci hovoří jako o „agentní“ AI. Oním agentem je myšleno to, že systém umělé inteligence je jako robot, který plní zadané úkoly.

V rámci Gemini 2.0 se do popředí dostává asistent Project Astra. Zaměřuje se na čistě praktické úkony. Zvládne třeba konverzovat v několika jazycích s podporou akcentu. Také umí používat nástroje, má přístup k mapám, vyhledávači i vizuálnímu hledání Google Lens.

V praxi funguje například tak, že telefonem namíříte na nějaký objekt, například na umělecké výstavě, a zeptáte se mobilu, co ví o onom objektu. Telefon následně odpoví. Ukázku můžete vidět ve videu výše.

Pro plynulou a přirozenější komunikaci taky Astra zapracovala na paměti, kdy si dokáže držet v povědomí posledních 10 minut konverzace. Mimo aplikaci Gemini by Google rád Astru integroval i do chytrých brýlí. Tam bude mít především vizuální vyhledávání potenciál asi největší.

AI Google Gemini budou moci konstruktivně využít i vývojáři

Dalším agentem je Project Mariner. Řeší komplexnější úkoly s tím, že postupuje krok po kroku s využitím nástrojů Google, především vyhledávačem. Vývojáře pak zase zaujme Jules. Ten se integruje přímo do workflow GitHubu. Pod dohledem vývojáře pak pomůže s řešením problému, plánuje postup a provádí jej.

Ohromující výkon. Mobilní procesor MediaTek Dimensity 9400 si chce konkurenci namazat na chleba

Překvapivě se další agent zabývá hraním her. Pomáhá orientovat se v hratelných virtuálních světech. Radí na základě toho, co vidí na obrazovce.

Google Gemini je novou velkou rybou v moři umělé inteligence

Article

Aktualizováno: 10. března 2024 • Autor: Peter Vnuk

Umělá inteligence (AI) je aktuálně největší trend technologického světa a potkávat ji budeme všude mnohem častěji, než jsme zvyklí. Její generativní druh započal svou velkou cestu do zařízení, jako jsou mobilní telefony, tablety, počítače nebo nositelná zařízení, hlavně díky ChatGPT. Google však přichází s modelem Gemini, který by mohl ChatGPT natrhnout triko a o kterém se v poslední době hodně mluví. Čím se Gemini liší a co vše umí?

Google Gemini představení

Google Gemini – OBSAH

Google Gemini a současná situace na poli umělé inteligence
Co může přinést Gemini obyčejnému člověku?
Google Gemini placený, nebo zdarma? Zatím jenom zdarma
Stojíme u zrodu nové éry chytrých telefonů

Google Gemini a současná situace na poli umělé inteligence

Rok 2023 byl rokem generativní umělé inteligence (AI). Široká veřejnost se začala zajímat o toto odvětví hlavně díky chatbotu ChatGPT od společnosti OpenAI, ve které měl kdysi svůj podíl i Elon Musk. Propracované a užitečné odpovědi ChatGPT měly úspěch a bylo otázkou času, kdy na tohoto nového a rychlého koně usedne i konkurence.

Jednou z nich je Bing AI, který se přejmenoval na Copilot a Microsoft ho aktuálně integruje do Windows 11. Kartami ale míchá i samotná společnost Google, která svého chatbota Bard poháněného modelem LaMDA přejmenovala na Gemini a dala mu nové jádro.

Model je trénován na obrovském množství dat, a tak dokáže odpovídat na otázky z oblastí jako věda, literatura, aktuální události ve světě, politika či historie. Právě přístup k aktuálním informacím z internetu je výhoda Gemini, kterou mnohá konkurence nemá. Například ChatGPT se omezuje na informace před lednem 2022.

Co může přinést Gemini běžnému člověku?

V praxi je podstatné, že generativní AI mění pravidla hry. Do rukou běžného člověka se dostává silný nástroj, který dokáže například na fotografii odstranit vrásky na vašem čele, zmenšit výrazně rušivý prvek nebo vizuálně odstranit osobu, která na záběru nemá co dělat.

Samsung Galaxy S24 Ultra (RECENZE): Evoluci střídá revoluce umělé inteligence

Generativní AI totiž dokáže díky tréninku na množství dat zamaskovat změny, a proto již nemusíte ovládat žádné „photoshopy“. Stačí po daném místě projet prstem či dotykovým perem. Telefon si většinu věcí domyslí, takže je to jednoduché, rychlé a zvládne to každý. Tím však výhody ani zdaleka nekončí.

Součástí modelů jako Google Gemini je také možnost kreativní konverzace s chatbotem. Může podle vašeho zadání napsat báseň či esej, poradí vám s upravením jídelníčku, abyste si zlepšili nabírání svalů či snižování hmotnosti, nebo si s vámi jednoduše promluví na jakékoliv téma prakticky na úrovni člověka.

Google Gemini představení — Porovnání schopností Gemini a ChatGPT při práci s textem. Zdroj: Blog Google

Úplně přirozeným jazykem s vámi Google Gemini probere například politickou situaci ve Venezuele. Vysvětlí vám, proč je v noci tma, přeloží článek v cizím jazyce nebo poradí, jak investovat do bitcoinu co nejbezpečněji.

Google vyvinul model Gemini jako multimodální, což znamená, že jeho schopnosti nekončí při kreativním či jiném rozhovoru. Má předpoklady pomoci svému uživateli i s programováním software nebo generováním a úpravou videí, zvukových záznamů či obrázků. V této chvíli ještě jeho úplný potenciál není veřejnosti přístupný, zatím pracuje s textem a informacemi, ale pravděpodobně se to změní v průběhu několika měsíců. Google přitom tvrdí, že Gemini je ve více než 50 testovaných oblastech schopností na úrovni lidských expertů.

Google Gemini placený, nebo zdarma? Zatím jenom zdarma

Aktuálně nabízejí firmy stojící za AI, jako je Google Gemini, vždy dvě alternativy. Placení chatboti jsou vždy mnohem sofistikovanější. Mají přístup k většímu množství informací, jsou kreativnější, méně omezují počet odpovědí, které měsíčně můžete dostat, a mají hromadu dalších výhod.

Samsung Galaxy S24 a S24+ (RECENZE): Umělá inteligence je tady. Kterého z bratrů si vybrat?

Ale je třeba zdůraznit, že bezplatná verze Gemini, která je dostupná pro každého, dokáže už nyní množství věcí, jež budou určitě nejednomu uživateli stačit. Kromě konverzace na různá témata zvládne bezplatná varianta i kreativní generování textu či jazykové překlady. Ve chvíli vzniku tohoto článku je k dispozici právě jen bezplatná verze, přičemž Google zdůrazňuje, že Gemini je celkově ve verzi beta a verze Pro (někde se uvádí i jako Advanced) a Enterprise nejsou přístupné široké veřejnosti.

V názvosloví placených verzí Gemini vládne tak trochu chaos a nic není jisté a jasné. Google aktuálně vyhodnocuje data z testování a registrace do placených verzí beta není možná. Jejich výhody a ceny však známe už nyní. Varianta Pro by měla nabídnout úplnou verzi Gemini za přibližně 1 200 Kč měsíčně s omezením na 100 tisíc odpovědí. Ta bezplatná se omezuje na 500 odpovědí měsíčně.

Pro podnikovou sféru je tu i varianta Enterprise, který má přinášet rychlejší reakce, výhody v oblasti podpory Google, mnohem vyšší počet odpovědí a přiděleného manažera účtu. Cena takového předplatného je však na vyžádání a odhaduje se nad 230 tisíc Kč měsíčně, takže bude zajímavá skutečně jen pro omezený počet specifických zákazníků.

Google pracuje na začlenění Gemini i do svého portfolia aplikací a služeb jako Gmail nebo Mapy. Takže AI, která bude mít přístup k e-mailovým zprávám a dalším personalizovaným informacím, bude schopná lépe pomáhat jednotlivcům i firmám například s optimalizací výdajů či v oblasti zdraví.

Stojíme u zrodu nové éry chytrých telefonů

Je jasné, že v roce 2024 se trend generativní AI bude zesilovat a postupně se bude tato technologie usazovat v mobilních telefonech. Prvními představiteli jsou členové nové generace smartphonů Galaxy S24 od Samsungu a již v této chvíli je jisté, že i nový iPhone 16 a iOS 18 budou plné nových prvků, které AI s sebou přináší. Karty však může velmi výrazně zamíchat umělá inteligence Gemini od Google.

Xiaomi 14 Ultra (PREVIEW): Top výbava s 1palcovým snímačem i 16 GB RAM

Je třeba říci, že nejde o žádné marketingové triky. Umělá inteligence dokáže skutečně vylepšit běžné používání mobilu například rozpoznáním a vyhledáním objektů na fotografii. Google má s jeho Gemini tu výhodu, že operační systém Android běží na miliardách chytrých telefonů po celém světě.

Když začne vyměňovat postaršího Asistenta Google za nového s jádrem Gemini, Samsung s jeho Galaxy AI či Apple s novou vylepšenou Siri budou mít velmi silnou konkurenci. A tento proces už začal, i když oficiálně pouze ve Spojených státech amerických. U nás je možné vyměnit Asistenta Google za Gemini zatím pouze aplikací z neoficiálních zdrojů.

Oficiálně je apka pouze v angličtině, ale ve skutečnosti podporuje Gemini češtinu i slovenštinu a dokáže v ní bez problémů komunikovat. To mu dává předpoklady nahradit Asistenta Google plnohodnotně i v našich končinách. Je to jenom otázka času.

Google Pixel 9 128GB Obsidian - Mobile Phone

4.8 157×

Google Pixel 9 128GB Obsidian

Mobile Phone 6,3" P-OLED 2424 × 1080, 120Hz, processor Google Tensor G4, RAM 12 GB, internal memory 128 GB, main camera 50 Mpx (f/1,68) + 48 Mpx (f/1,7), selfie camera 10,5 Mpx, optical (ois) and electronic (eis) stabilization, GPS, NFC, LTE, 5G, USB-C, fingerprint reader in screen, dual SIM, water resistant IP68, unlocked, quick charging 27W, wireless charging, reverse charging 5W, battery 4700 mAh, Android 14

14,990,-

Watch

Currently Unavailable

Order Code: GPX1077b1

Google Pixel 9 Pro XL 128GB Obsidian - Mobile Phone

4.8 116×

Google Pixel 9 Pro XL 128GB Obsidian

Mobile Phone 6,75" P-OLED 2992 × 1344, 120Hz, processor Google Tensor G4 8-core, RAM 8 GB, internal memory 128 GB, main camera with optical zoom 50 Mpx (f/1,68) + 48 Mpx (f/2,8) + 48 Mpx (f/1,7), selfie camera 42 Mpx, optical (ois) and electronic (eis) stabilization, GPS, NFC, LTE, 5G, UWB, USB-C, fingerprint reader in screen, dual SIM, water resistant IP68, unlocked, quick charging 37W, wireless charging, reverse charging, battery 5060 mAh, Android 14

Buy at the price for both existing and new AlzaPlus+ members 16,641,-

18,490,-

Buy

In stock > 5 pcs

Order Code: GPX1079b1

Samsung Galaxy A56 8GB/128GB Awesome Graphite - Mobile Phone

4.8 362×

Samsung Galaxy A56 8GB/128GB Awesome Graphite

Mobile Phone 6,7" AMOLED 2340x1080, 120Hz, processor Samsung Exynos 1580 8-core, RAM 8 GB, internal memory 128 GB, main camera 50 Mpx (f/1,8) + 12 Mpx (f/2,2) + 5 Mpx (f/2,4), selfie camera 12 Mpx, GPS, NFC, LTE, 5G, USB-C, fingerprint reader in screen, Dual SIM + eSIM, water resistant IP67, unlocked, quick charging 45W, battery 5000 mAh, Android 15

9,990,-

Watch

Currently Unavailable

Order Code: SAMO0274b1