Zkuste naše cookies My, společnost Alza.cz a.s., IČO 27082440 používáme soubory cookies a další údaje k zajištění funkčnosti webu a s Vaším souhlasem i mj. k personalizaci obsahu našich webových stránek. Kliknutím na tlačítko „Rozumím“ souhlasíte s využívaním cookies a dalších údajů vč. jejich předání pro zobrazení cílené reklamy na sociálních sítích a reklamních sítích na dalších webech.
Alzak icon

Budoucnost: AI a hlasové ovládání

Článek

Aktualizováno • Autor: Michal Rybka

S tím, jak se rozvíjejí nové technologie, prosazují se i nové formy ovládání. Hlasové ovládání je technologie, kterou předvídali vlastně všichni autoři scifi: Bavit se s počítačem lidským hlasem je přece tak intuitivní a snadné! Na hlasové ovládání narazíme v Kubrickově 2001: A Space Odyssey (1968), kde hanebný počítač nejenže odmítá plnit lidské rozkazy, ale také se pokouší kamerami odečítat ze rtů, jak se na něj lidé domlouvají. V Příbězích pilota Pirxe od Stanislawa Lema (1966) sice počítač rachotí svými relé, ale umí rozeznat hlasové příkazy a odpovídat na ně. Hlas je prostě intuitivní věc, takže všichni čekali, že se ovládání hlasem objeví brzy.

Chytrá AI
Zdroj obrázku.

Budoucnost: AI a hlasové ovládání – OBSAH

  1. Rozeznávání hlasu je problém
  2. Rozvoj hlasového ovládání v posledních letech

Rozeznávání hlasu je problém

Ale ouha! Zatímco hlasová syntéza je relativně jednoduchý úkol – tedy pokud netrváte na tom, aby to znělo přirozeně, rozeznávání hlasu složitý problém je. Pracuje se na něm dlouho: Konkrétně v roce 1952 se objevil systém Audrey, vyvinutý v Bell Labs, který uměl rozeznávat hlasem zadávané číslice. Na Seattle World Fair 1962 představila IBM projekt Shoebox, což byl stroj, který uměl rozeznávat šestnáct slov. Nevýhodou bylo to, že se na každého mluvčího musel nastavit zvlášť – co si budeme povídat, lidem je někdy těžké rozumět, i když jste sami člověk.

V sedmdesátých letech se do věci vložila americká DARPA, která se rozhodla zasponzorovat program, jehož výsledkem by byl stroj, který by se naučil rozeznávat alespoň tisíc slov. To se podařilo splnit, ale vývoj nešel příliš rychle, ještě v polovině 80. let byl nejlepším projektem Tangora od IBM, která dokázala rozeznat dvacet tisíc slov. Díky pokrokům v AI už stroj dokázal odhadovat pravděpodobnost, že zvuk, který nedokázal přesně rozeznat, je součástí slova.

i

Historie počítačů (TÉMA)

V roce 1990 se konečně objevil Dragon Dictate, první komerční systém pro rozeznávání diktátu, který ale vyžadoval zřetelnou mluvu a jasné oddělování slov. Teprve v roce 2002 se ale objevuje rozeznávání řeči jako standardní součást Microsoft Office. Obrovské pokroky pro rozeznávání řeči znamenal internet. Dovolil tvorbu služeb, kdy se program mohl kdykoliv připojit k serveru s nerozeznatelnou sekvencí, která se pak použila pro další trénink systému. Zpětná vazba je důležitou součástí vývoje umělé inteligence a dovoluje její rozvíjení. Není proto divu, že to byl Google, kdo jako první uvedl hlasové ovládání pro mobilní zařízení v roce 2008.

Rozvoj hlasového ovládání v posledních letech

V té době už svoje technologie připravovali všichni velcí hráči. Apple oznámil v roce 2011 technologii Siri, Microsoft uvedl v roce 2014 Cortanu a v témže roce Amazon představil technologii Echo pro jejich domácího asistenta Alexu. Tyto technologie jsou na jednu stranu trochu děsivé, protože domácí zařízení vás vlastně „tak trochu stále poslouchají“, dovolují ale extrémně jednoduché zadávání příkazů, i když máte „plné ruce práce“, takže vlastně plní roli vašeho osobního asistenta.

Siri
Asistentka Siri je notoricky známá součást ekosystému společnosti Apple.

Pro úspěch hlasového ovládání je důležitý právě vzestup umělé inteligence, její schopnosti učit se z rozsáhlých dat a pracovat s neurčitou informací. Moderní AI chápe do značné míry kontext rozhovoru, takže místo zadávání příkazů vedete se zařízením svého druhu dialog. Můžete klást doplňující dotazy, ale také žádat svého asistenta o zábavu či o to, aby vás pobavil vtipem. Tohle už je komunikace blížící se představám autorů sci-fi!

S rozeznáváním hlasu ovšem vývoj ovládání nekončí. Dalším krokem bude ovládání na základě obrazu a dalších dat, které je nezbytné pro vývoj autonomních vozidel. Ta musí zpracovávat velmi komplexní informace včetně rozeznávání dopravních značek a provádět řadu autonomních rozhodnutí. Zjednodušeně řečeno můžeme říci, že budoucnost ovládání strojů je vlastně v tom, že už je nebudeme ovládat krok za krokem, ale necháme je rozhodovat se do značné míry samostatně.

i Mohlo by vás zajímat

Už v raných sci-fi se objevovaly představy o tom, že počítače budoucnosti se nebudou programovat, jenom se jim specifikuje úkol a ony vše vyřeší samy. Zatím se podobné úrovni ani neblížíme, ale velkou řadu úkolů už zvládají stroje je s malou asistencí a nebo se supervizí. Mezitím se objevují domácí spotřebiče s rozšířenou funkčností: Dnes jsme už navyklí na to, že automatická pračka vše zvládne sama, ale co třeba kuchyňský robot, který z větší části navaří sám? Vy si vyberete jídlo, on vám řekne co potřebuje za suroviny, kdy mu je máte dát - a většinu práce odvede za vás!

Michal Rybka

Michal Rybka

Michal Rybka je publicista a nadšenec s 20 lety zkušeností v IT a gamingu. Je kurátorem AlzaMuzea a YouTube kanálu AlzaTech. Napsal několik fantasy a sci-fi povídek, které vyšly v knižní podobě, a pravidelně pokrývá páteční obsah na internetovém magazínu PCTuning.

4,8 1 017×
Apple HomePod mini bílý - EU
Hlasový asistent Siri - v angličtině, kompatibilní aplikace Apple Home, podpora iOS, připojení přes WiFi 2,4 GHz a bluetooth, otevřený systém, fungování samostatně, ovládání domácnosti, kamera, 2 mikrofony ke snímání okolního zvuku, podporuje Apple Music, basový reproduktor
3 190,-
Momentálně nedostupné
Objednací kód: JA041a1
3,5 29×
iGET SECURITY M5-4G Premium - inteligentní zabezpečovací systém 4G LTE/WiFi/LAN, set
Centrální jednotka - kompatibilní s aplikacemi výrobce, podpora Android a iOS, připojení přes WiFi 2,4 GHz, GSM a rádiové vlny, uzavřený systém, ovládání zabezpečení, vzdálený přístup, pro správu až 1000 zařízení
5 999,-
Skladem > 5 ks
Do půlnoci objednáš, ráno v AlzaBoxu máš.
Info
Objednací kód: iGt21014
4,4 155×
Amazon Echo Dot (5th Gen) Charcoal
Hlasový asistent Amazon Alexa - v angličtině, ve španělštině, podpora Android a iOS, připojení přes WiFi 2,4 GHz, WiFi 5 GHz a bluetooth, otevřený systém, fungování samostatně, ovládání domácnosti, tvorba scénářů a vzdálený přístup, tlačítko na odpojení mikrofonu, 1 mikrofon ke snímání okolního zvuku, podporuje Spotify, Apple Music a Amazon Music
1 449,-
Na cestě > 5 ks
Očekáváme 28.05.2026
Objednací kód: AMAECHDO5TH
4,8 62×
Amazon Echo Pop (1st Gen) Charcoal
Hlasový asistent Amazon Alexa - v angličtině, ve španělštině, kompatibilní s aplikacemi výrobce, podpora Android a iOS, připojení přes WiFi 2,4 GHz, WiFi 5 GHz a bluetooth, otevřený systém, fungování samostatně, ovládání domácnosti, tvorba scénářů a vzdálený přístup, tlačítko na odpojení mikrofonu, podporuje Spotify, Apple Music, Amazon Music, SiriusXM a Audible
999,-
Momentálně nedostupné
Objednací kód: AME1043
4,6 15×
Amazon Echo Show 8 (3rd gen) Charcoal
Hlasový asistent Amazon Alexa - podpora Android a iOS, připojení přes WiFi 2,4 GHz a bluetooth, fungování samostatně, sluchátkový výstup, displej, kamera a tlačítko na odpojení mikrofonu, podporuje Amazon Prime Video, Netflix, YouTube, Spotify, Apple Music, Amazon Music a Pandora, basový reproduktor, uhlopříčka displeje 8", rozlišení displeje 1280 × 800, dotykové ovládání
5 399,-
Na cestě > 5 ks
Očekáváme 04.06.2026
Objednací kód: ANE1046
4,7 158×
Apple HomePod (2nd generation) White
Hlasový asistent Siri - v angličtině, kompatibilní s aplikacemi výrobce, podpora iOS, připojení přes WiFi 2,4 GHz a bluetooth, otevřený systém, fungování samostatně, ovládání domácnosti, vzdálený přístup, 4 mikrofony ke snímání okolního zvuku, podporuje Apple Music, YouTube Music a Pandora, výškový reproduktor
+Dárek Cestovní adaptér AlzaPower v hodnotě 149,-
8 999,-
Skladem > 5 ks
Do půlnoci objednáš, ráno v AlzaBoxu máš.
Info
Objednací kód: apple23_01
4,8 189×
Google Pixel 9a 8GB/128GB Obsidian
Mobilní telefon - 6,3" AMOLED 2424 × 1080 (120Hz), úložiště: 128 GB, RAM: 8 GB, fotoaparát: 48Mpx (f/1,7) hlavní + 13Mpx širokoúhlý + 13Mpx přední, CPU: Google Tensor G4, NFC, USB-C, 5G, dual SIM, čtečka otisků, voděodolný dle IP68, rychlé nabíjení 23Wbezdrátové nabíjení 7,5W, baterie 5100 mAh, model 2025, Android
10 990,-
Skladem > 5 ks
Do půlnoci objednáš, ráno v AlzaBoxu máš.
Info
Objednací kód: GPX1080b1
4,8 28×
Google Pixel 10a 128GB Obsidian
Mobilní telefon - 6,3" P-OLED 2424 × 1080 (120Hz), úložiště: 128 GB, RAM: 8 GB, fotoaparát: 48Mpx (f/1,7) hlavní + 13Mpx širokoúhlý + 13Mpx přední, CPU: Google Tensor G4, NFC, USB-C, 5G, dual SIM, čtečka otisků, voděodolný dle IP68, rychlé nabíjení 30Wbezdrátové nabíjení, baterie 5100 mAh, model 2026, Android
+Dárek Kryt na mobil Google Pixel 10a Case Obsidian v hodnotě 989,-
13 590,-
Skladem > 5 ks
Do půlnoci objednáš, ráno v AlzaBoxu máš.
Info
Objednací kód: GPX1084b1
4,4 41×
Google Pixel 10 256GB Obsidian
Mobilní telefon - 6,3" AMOLED 2424 × 1080 (120Hz), úložiště: 256 GB, RAM: 12 GB, fotoaparát: 48Mpx (f/1,73) hlavní + 13Mpx širokoúhlý + 10,8Mpx teleobjektiv + 10,5Mpx přední, CPU: Google Tensor G5, NFC, USB-C, 5G, dual SIM, čtečka otisků, voděodolný dle IP68, rychlé nabíjení 30Wbezdrátové nabíjení 15W, baterie 4970 mAh, model 2025, Android
19 499,-
Skladem > 5 ks
Do půlnoci objednáš, ráno v AlzaBoxu máš.
Info
Objednací kód: GPX1081c4
Vytisknout
P-DC1-WEB22