Try our cookies Alza.cz a. s., Company identification number 27082440, uses cookies to ensure the functionality of the website and with your consent also to personalisage the content of our website. By clicking on the “I understand“ button, you agree to the use of cookies and the transfer of data regarding the behavior on the website for displaying targeted advertising on social networks and advertising networks on other websites.
Alzak icon

Budoucnost: AI a hlasové ovládání

Article

Aktualizováno • Autor: Michal Rybka

S tím, jak se rozvíjejí nové technologie, prosazují se i nové formy ovládání. Hlasové ovládání je technologie, kterou předvídali vlastně všichni autoři scifi: Bavit se s počítačem lidským hlasem je přece tak intuitivní a snadné! Na hlasové ovládání narazíme v Kubrickově 2001: A Space Odyssey (1968), kde hanebný počítač nejenže odmítá plnit lidské rozkazy, ale také se pokouší kamerami odečítat ze rtů, jak se na něj lidé domlouvají. V Příbězích pilota Pirxe od Stanislawa Lema (1966) sice počítač rachotí svými relé, ale umí rozeznat hlasové příkazy a odpovídat na ně. Hlas je prostě intuitivní věc, takže všichni čekali, že se ovládání hlasem objeví brzy.

Chytrá AI
Zdroj obrázku.

Budoucnost: AI a hlasové ovládání – OBSAH

  1. Rozeznávání hlasu je problém
  2. Rozvoj hlasového ovládání v posledních letech

Rozeznávání hlasu je problém

Ale ouha! Zatímco hlasová syntéza je relativně jednoduchý úkol – tedy pokud netrváte na tom, aby to znělo přirozeně, rozeznávání hlasu složitý problém je. Pracuje se na něm dlouho: Konkrétně v roce 1952 se objevil systém Audrey, vyvinutý v Bell Labs, který uměl rozeznávat hlasem zadávané číslice. Na Seattle World Fair 1962 představila IBM projekt Shoebox, což byl stroj, který uměl rozeznávat šestnáct slov. Nevýhodou bylo to, že se na každého mluvčího musel nastavit zvlášť – co si budeme povídat, lidem je někdy těžké rozumět, i když jste sami člověk.

V sedmdesátých letech se do věci vložila americká DARPA, která se rozhodla zasponzorovat program, jehož výsledkem by byl stroj, který by se naučil rozeznávat alespoň tisíc slov. To se podařilo splnit, ale vývoj nešel příliš rychle, ještě v polovině 80. let byl nejlepším projektem Tangora od IBM, která dokázala rozeznat dvacet tisíc slov. Díky pokrokům v AI už stroj dokázal odhadovat pravděpodobnost, že zvuk, který nedokázal přesně rozeznat, je součástí slova.

i

Historie počítačů (TÉMA)

V roce 1990 se konečně objevil Dragon Dictate, první komerční systém pro rozeznávání diktátu, který ale vyžadoval zřetelnou mluvu a jasné oddělování slov. Teprve v roce 2002 se ale objevuje rozeznávání řeči jako standardní součást Microsoft Office. Obrovské pokroky pro rozeznávání řeči znamenal internet. Dovolil tvorbu služeb, kdy se program mohl kdykoliv připojit k serveru s nerozeznatelnou sekvencí, která se pak použila pro další trénink systému. Zpětná vazba je důležitou součástí vývoje umělé inteligence a dovoluje její rozvíjení. Není proto divu, že to byl Google, kdo jako první uvedl hlasové ovládání pro mobilní zařízení v roce 2008.

Rozvoj hlasového ovládání v posledních letech

V té době už svoje technologie připravovali všichni velcí hráči. Apple oznámil v roce 2011 technologii Siri, Microsoft uvedl v roce 2014 Cortanu a v témže roce Amazon představil technologii Echo pro jejich domácího asistenta Alexu. Tyto technologie jsou na jednu stranu trochu děsivé, protože domácí zařízení vás vlastně „tak trochu stále poslouchají“, dovolují ale extrémně jednoduché zadávání příkazů, i když máte „plné ruce práce“, takže vlastně plní roli vašeho osobního asistenta.

Siri
Asistentka Siri je notoricky známá součást ekosystému společnosti Apple.

Pro úspěch hlasového ovládání je důležitý právě vzestup umělé inteligence, její schopnosti učit se z rozsáhlých dat a pracovat s neurčitou informací. Moderní AI chápe do značné míry kontext rozhovoru, takže místo zadávání příkazů vedete se zařízením svého druhu dialog. Můžete klást doplňující dotazy, ale také žádat svého asistenta o zábavu či o to, aby vás pobavil vtipem. Tohle už je komunikace blížící se představám autorů sci-fi!

S rozeznáváním hlasu ovšem vývoj ovládání nekončí. Dalším krokem bude ovládání na základě obrazu a dalších dat, které je nezbytné pro vývoj autonomních vozidel. Ta musí zpracovávat velmi komplexní informace včetně rozeznávání dopravních značek a provádět řadu autonomních rozhodnutí. Zjednodušeně řečeno můžeme říci, že budoucnost ovládání strojů je vlastně v tom, že už je nebudeme ovládat krok za krokem, ale necháme je rozhodovat se do značné míry samostatně.

i Mohlo by vás zajímat

Už v raných sci-fi se objevovaly představy o tom, že počítače budoucnosti se nebudou programovat, jenom se jim specifikuje úkol a ony vše vyřeší samy. Zatím se podobné úrovni ani neblížíme, ale velkou řadu úkolů už zvládají stroje je s malou asistencí a nebo se supervizí. Mezitím se objevují domácí spotřebiče s rozšířenou funkčností: Dnes jsme už navyklí na to, že automatická pračka vše zvládne sama, ale co třeba kuchyňský robot, který z větší části navaří sám? Vy si vyberete jídlo, on vám řekne co potřebuje za suroviny, kdy mu je máte dát - a většinu práce odvede za vás!

Michal Rybka

Michal Rybka

Michal Rybka je publicista a nadšenec s 20 lety zkušeností v IT a gamingu. Je kurátorem AlzaMuzea a YouTube kanálu AlzaTech. Napsal několik fantasy a sci-fi povídek, které vyšly v knižní podobě, a pravidelně pokrývá páteční obsah na internetovém magazínu PCTuning.

4.8 1,016×
Apple HomePod mini white - EU
Voice Assistant - Apple Home, Siri for Apple HomeKit, OS supported: iOS controls your smart home and plays music, 2 ambient sound microphones, Camera, EU distribution, language used: English and German. Siri - in English, compatible Apple Home apps, iOS support, connection via WiFi 2.4 GHz and Bluetooth, open system, functioning independently, home control, camera, 2 microphones to pick up ambient sound, Supports Apple Music, woofer
3,190,-
Currently Unavailable
Order Code: JA041a1
3.5 29×
iGET SECURITY M5-4G Premium - intelligent security system 4G LTE/WiFi/LAN, set
Central Unit - used as security, connect using WiFi 2,4 GHz, GSM and Radio frequency, communication via Manufacturer app, compatible with Android and iOS, power plug power supply
5,999,-
Buy
In stock > 5 pcs
Order by midnight, get it at the AlzaBox in the morning.
Info
Order Code: iGt21014
4.8 62×
Amazon Echo Pop (1st Gen) Charcoal
Voice Assistant - Manufacturer app, OS supported: Android and iOS controls your smart home and plays music, Microphone mute button, language used: English.
999,-
Currently Unavailable
Order Code: AME1043
4.6 15×
Amazon Echo Show 8 (3rd gen) Charcoal
Voice Assistant - OS supported: Android and iOS controls your smart home and plays music, Headphone output, Display, Camera and Microphone mute button,.
3,690,-
Buy
On the way 2 pcs
Expected 30/04/2026
Order Code: ANE1046
4.7 158×
Apple HomePod (2nd generation) Midnight
Voice Assistant - Apple Home and Manufacturer app, Siri for Apple HomeKit, OS supported: iOS controls your smart home and plays music, 4 ambient sound microphones, language used: English.
+Gift Travel Adapter AlzaPower with a value of 149,-
8,999,-
Buy
In stock > 5 pcs
Order Code: apple23_02
4.7 158×
Apple HomePod (2nd generation) White
Voice Assistant - Apple Home and Manufacturer app, Siri for Apple HomeKit, OS supported: iOS controls your smart home and plays music, 4 ambient sound microphones, language used: English.
+Gift Travel Adapter AlzaPower with a value of 149,-
8,999,-
Buy
In stock > 5 pcs
Order by midnight, get it at the AlzaBox in the morning.
Info
Order Code: apple23_01
4.8 187×
Google Pixel 9a 8GB/128GB Obsidian
Mobile Phone 6,3" AMOLED 2424 × 1080, 120Hz, processor Google Tensor G4, RAM 8 GB, internal memory 128 GB, main camera 48 Mpx (f/1,7) + 13 Mpx (f/2,2), selfie camera 13 Mpx, optical (ois) stabilization, GPS, NFC, LTE, 5G, USB-C, dual SIM, water resistant IP68, unlocked, quick charging 23W, wireless charging 7,5W, battery 5100 mAh, Android 15
10,990,-
Buy
In stock > 5 pcs
Order by midnight, get it at the AlzaBox in the morning.
Info
Order Code: GPX1080b1
4.8 22×
Google Pixel 10a 128GB Obsidian
Mobile Phone 6,3" P-OLED 2424 × 1080, 120Hz, processor Google Tensor G4, RAM 8 GB, internal memory 128 GB, main camera 48 Mpx (f/1,7) + 13 Mpx (f/2,2), selfie camera 13 Mpx, optical (ois) and electronic (eis) stabilization, GPS, NFC, LTE, 5G, USB-C, dual SIM, water resistant IP68, unlocked, quick charging 30W, wireless charging, battery 5100 mAh, Android 16
+Gift Phone Cover Google Pixel 10a Case Obsidian with a value of 989,-
With cashback bonus In return for an older model, the customer will get a discount on the newer model. Vyměňte starý telefon za nový a získejte při nákupu Google Pixel 10a zpět 2 500 Kč. Pro uplatnění bonusu je možné odevzdat jakýkoli starší telefon. Platí do 30.04.2026. 11,090,-
13,590,-
Buy
In stock > 5 pcs
Order by midnight, get it at the AlzaBox in the morning.
Info
Order Code: GPX1084b1
4.6 38×
Google Pixel 10 256GB Obsidian
Mobile Phone 6,3" AMOLED 2424 × 1080, 120Hz, processor Google Tensor G5, RAM 12 GB, internal memory 256 GB, main camera 48 Mpx (f/1,73) + 10,8 Mpx (f/3,1) + 13 Mpx (f/2,2), selfie camera 10,5 Mpx, optical (ois) and electronic (eis) stabilization, GPS, NFC, LTE, 5G, USB-C, dual SIM, water resistant IP68, unlocked, quick charging 30W, wireless charging 15W, battery 4970 mAh, Android 16
19,499,-
Buy
In stock > 5 pcs
Order by midnight, get it at the AlzaBox in the morning.
Info
Order Code: GPX1081c4
Print
P-DC1-WEB01