Co je OCR (optické rozpoznávání znaků)?

Aktualizováno 21. září 2025 • Autor: Redakce

OCR (Optical Character Recognition, česky optické rozpoznávání znaků) je technologie, která dokáže převést text zachycený na obrázku nebo ve skenovaném dokumentu na strojově čitelný text. Díky tomu lze s původně „obrázkovým“ textem dále pracovat – kopírovat ho, vyhledávat v něm, nebo jej automatizovaně zpracovávat.

Jak OCR funguje

Naskenování nebo vyfocení textu – vstupem je obrazový soubor (JPEG, PNG, PDF).
Předzpracování obrazu – odstranění šumu, zvýšení kontrastu, narovnání textu.
Segmentace – rozdělení dokumentu na jednotlivé znaky, slova a odstavce.
Rozpoznávání znaků – software porovnává tvary s databází písem, případně využívá neuronové sítě.
Postprocessing – opravy pomocí slovníků a jazykových modelů.

Výsledkem je digitální textová vrstva, která se dá editovat a vyhledávat.

K čemu se OCR používá

OCR nachází uplatnění v celé řadě oblastí každodenní praxe. Nejčastěji se využívá při digitalizaci knih a archivních dokumentů, kde pomáhá převést historické materiály do elektronické podoby. Důležitou roli hraje také při práci s PDF soubory – pokud je dokument uložen jen jako obrázek, OCR vytvoří textovou vrstvu, díky níž lze v souboru vyhledávat nebo kopírovat text.

Ve firmách se technologie používá k automatickému zpracování faktur, účtenek či smluv, čímž výrazně šetří čas a minimalizuje chybovost.

OCR se uplatňuje i v mobilních aplikacích, například v překladačích, které dokážou rozpoznat text přímo z kamery telefonu. A v neposlední řadě má význam i v oblasti asistence pro nevidomé a slabozraké, kde zajišťuje převod tištěného textu do hlasového výstupu.

Návod, jak vybrat skener

Správně zvolený skener vám ušetří čas, místo i nervy. Moderní skenery zvládnou převést papírové dokumenty i fotografie do digitální podoby během pár sekund, uloží je rovnou do PDF, pomohou rozpoznat text (OCR) a bezpečně synchronizují do cloudu. V tomto průvodci vás krok za krokem provedeme výběrem – od základních otázek přes klíčové parametry až po konkrétní typy skenerů pro domácnosti, kanceláře i kreativce.

Jak vybrat skener

Jak kvalitní je OCR

Přesnost OCR není 100%. Přesnost se v poslední době výrazně zlepšila díky umělé inteligenci, která si dnes poradí i s komplikovanými fonty a rukopisy (tzv. ICR – Intelligent Character Recognition). Obecně však platí, že přesnost OCR závisí na několika faktorech:

kvalita zdroje (rozlišení, kontrast, absence rušivých prvků),
jazyk a typ písma (strojově tištěný text se rozpoznává lépe než rukopis),
software (např. Tesseract, ABBYY FineReader, Adobe Acrobat, Google Vision AI),
následná kontrola – pravopisné slovníky a jazykové modely opravují chyby.

ChatGPT a další AI jako OCR náhrada

V posledních letech se k tradičním OCR programům přidaly i generativní AI nástroje, jako je ChatGPT nebo Google Lens. Nejsou sice vyloženě navržené pro optické rozpoznávání znaků, ale zvládnou převést text z fotografie nebo skenu do podoby, se kterou lze dál pracovat.

Pro běžného uživatele to znamená, že když vyfotí stránku knihy nebo účet telefonem, nemusí složitě instalovat specializovaný OCR software – stačí použít aplikaci, která má AI funkce integrované. Výhodou je navíc to, že AI dokáže text rovnou opravit, přeložit nebo přeformátovat, takže odpadá další ruční práce.

Na velké dávky dokumentů s vysokými nároky na přesnost sice stále vedou specializované OCR programy, ale pro každodenní potřebu obyčejného uživatele jsou dnes AI aplikace často jednodušší a praktičtější cestou.

Skenery