Try our cookies Alza.cz a. s., Company identification number 27082440, use cookies and other data to ensure the proper functioning of the website and, with your consent, also, among other things, to personalize advertising and the content of our websites. By clicking on the “I understand“ button, you agree to the use of cookies and the transfer of data regarding the behavior on the website for displaying targeted advertising on social networks and advertising networks on other websites.
Alzak icon

Jak snizit naklady na ai

Article

• Autor: Redakce

Většina firem dnes posílá veškerou svoji AI přes špičkové cloudové modely – včetně rutinní, vysokoobjemové práce, která jejich hloubku vůbec nepotřebuje. Dřív než je to otázka rizika, je to prostá neefektivita portfolia: platíte prémiovou cenu za úlohy, kde rozhoduje kvantita a pravidelnost, ne komplexita. Zátěž jde rozdělit podle toho, co konkrétní úloha skutečně vyžaduje – a výsledek se vyplatí sám. Nižší závislost na cizí infrastruktuře je přitom příjemný bonus, ne hlavní důvod.

Ne každá úloha potřebuje špičkový model

Klíčová otázka nezní „cloud, nebo vlastní server". Zní: potřebuje tahle konkrétní úloha špičkový model, nebo ne? A u překvapivě velké části firemní agendy je odpověď záporná.

Úlohy se dělí na dvě skupiny. V první rozhoduje hloubka a komplexita – náročné uvažování, práce na hraně schopností modelu, nejnovější funkce. Tam špičkový cloudový model přidává reálnou hodnotu a nemá smysl ho nahrazovat. Ve druhé rozhoduje kvantita, pravidelnost a relativní jednoduchost:

  • shrnování dokumentů
  • klasifikace
  • vyhledávání ve firemních datech
  • koncepty textů
  • rutinní podpora podle interní znalostní báze

Tady dnes open-weight modely provozované u vás bohatě stačí – a jde o většinu běžné agendy.

Smysl nasazení tedy není „přesunout vše domů", ale poslat každou úlohu tam, kam patří.

Proč se rozdělení vyplatí i bez vnějšího rizika

Tohle rozdělení se vyplatí samo, i kdyby žádné vnější riziko neexistovalo. Stálá, vysokoobjemová rutina je přesně profil, kde se vlastní infrastruktura ekonomicky vyplácí – neplatíte za každý token prémiovou sazbu za schopnost, kterou daná úloha nevyužije. Kde přesně leží váš bod zlomu, ukáže TCO kalkulačka.

Rutinní zátěž navíc roste předvídatelně – škálujete ji na vlastní kapacitě, aniž by vám úměrně rostl tokenový účet. O kapacitě přitom nerozhoduje počet uživatelů, ale počet souběžně obsluhovaných požadavků – rozumně dimenzovaný stroj proto pokryje větší tým, než by se zdálo.

Když rutina jede lokálně, váš rozpočet na špičkovou AI se soustředí tam, kde reálně přidává hodnotu. Místo aby se rozmělnil na tisíce levných úkolů, financuje právě tu hloubku, kvůli které špičkový model smysl dává.

Odolnost jako vedlejší přínos

Stejné rozdělení má i vedlejší přínos. Špičková AI je dnes z velké části v rukou několika zahraničních poskytovatelů a stala se předmětem zájmu vlád. V červnu 2026 musela jedna přední laboratoř ze dne na den vypnout své nejvýkonnější modely kvůli vládní směrnici – dotklo se to i nezúčastněných platících zákazníků. Není to selhání trhu, které dopadne na všechny stejně; je to asymetrický zásah, který může postihnout jen firmy v určité jurisdikci, zatímco konkurence jinde jede dál. To je jediný typ rizika, kde můžete ztratit pozici vůči soupeři bez vlastní chyby a bez varování – a kde tedy levné ošetření dává smysl.

Pokud rutina běží i lokálně, z akutní krize se stane dílčí nepříjemnost. A je to ošetření zadarmo: děláte ho stejně, kvůli nákladům a škálování.

i

Jsou rizika, která neporazíte

Má to ale mez. Připravovat se na scénář, kdy někdo odřízne nejen AI, ale i cloud, databáze nebo operační systém, nedává pro firmu smysl – příprava by byla prohibitivně drahá a oddálila by jen nevyhnutelné. Rozumný rozsah ošetření sahá po AI vrstvu, ne dál. Co tuto vrstvu přesahuje, přesahuje i dosah firmy.

Silné argumenty pro vlastní infrastrukturu

Úsporová matematika je mimochodem nejslabším argumentem – zkušený rozhodovatel jí od dodavatele hardwaru automaticky nedůvěřuje. Silné jsou naopak brány, které neprodávají číslo, ale fakt:

  • Rozběhne to vůbec model, který potřebuji, použitelnou rychlostí?" (schopnost)
  • Smím ta data vůbec poslat do cizího cloudu?" (compliance, často binární blokátor – GDPR, sektorová regulace)

Provozní kontinuita patří do téže kategorie jako compliance: je to argument, kde je vlastní řešení kategoricky jinde, ne jen o pár procent levnější. Kde se sejde citlivost dat, stálý objem a kritičnost pro provoz, se rozdělení zátěže nepřeklápí lokálně kvůli ceně – překlápí se kvůli kontrole.

Vrstvená architektura jako výsledek

Výsledkem není volba jednoho tábora, ale vrstvená architektura, která je pro většinu firem nejrealističtější cestou: rutinu pod vlastní střechou, špičku a nárazové úlohy v cloudu. Získáte tím nižší náklady, lepší škálování i soustředěnější fokus – a odolnost mimochodem.

Mimo dosah jednotlivé firmy zůstává systémová rovina: že nejlepší modely nejsou evropské a celá ekonomika na nich visí. To je úkol pro politiku – vlastní a evropská řešení, diplomacii, snižování závislosti na úrovni země. Firma to neuzvedne – a neměla by ani zkoušet; její role je provozovat rozumné portfolio, ne suplovat strategickou autonomii státu.

Neposílejte tedy veškerou AI tam, kde platíte za schopnost, kterou polovina úloh nevyužije. Rutinu na lokální modely, špičku do cloudu – to je portfolio, které se vyplatí samo a které vám navíc, zcela mimochodem, sníží expozici jedinému riziku, jež za levné ošetření stojí. Kde leží váš bod zlomu a jaká velikostní třída odpovídá vašemu provozu, pomůže určit TCO kalkulačka a srovnání tříd.

Slovník pojmů

Co je cloudová AI?

AI model, ke kterému přistupujete přes internet. Běží na serverech poskytovatele – OpenAI, Anthropic, Google a dalších – a platíte za každý zpracovaný dotaz.

Nevyžaduje vlastní hardware, ale data při každém dotazu opouštějí vaši firmu a míří na cizí infrastrukturu.

Co je lokální AI model?

AI model nainstalovaný a spuštěný přímo na vašem hardwaru. Data nikdy neopouštějí vaši síť.

Platíte jednorázově za hardware a provoz – ne za každý dotaz. Nevyžaduje stálé připojení k internetu ani souhlas s podmínkami externího poskytovatele.

Co je open-weight model?

AI model, jehož parametry jsou veřejně dostupné ke stažení a spuštění na vlastním hardwaru. Příklady: Llama (Meta), Mistral nebo Qwen.

Výkon nejlepších cloudových modelů zatím nedosahují, ale na rutinní firemní úlohy – klasifikaci, shrnutí, vyhledávání v datech – bohatě stačí.

Co jsou tokeny?

Základní jednotka, ve které AI zpracovává text. Přibližně 1 token odpovídá 0,75 slova v angličtině.

Cloudové modely účtují cenu za každý zpracovaný token – proto se vysokoobjemová rutina v cloudu rychle prodraží, zatímco na lokálním modelu stojí jen výpočetní čas.

Co je TCO kalkulačka?

Nástroj pro výpočet celkových nákladů na vlastnictví (z angl. Total Cost of Ownership). Zahrnuje pořizovací cenu hardwaru, energie, správu a odpisy.

Umožňuje porovnat jednorázovou investici do vlastní infrastruktury s průběžnými náklady na cloudové API a zjistit, kde leží váš bod zlomu.

Co znamená compliance v kontextu AI?

Soulad s právními a regulačními požadavky. V kontextu AI jde zejména o GDPR a sektorovou regulaci – v bankovnictví, zdravotnictví nebo energetice.

Pokud zákon zakazuje posílat určitá data do zahraničního cloudu, compliance je binární blokátor: ne otázka ceny, ale zákonnosti.

Závada Václav

Václav Závada

Václav absolvoval ekonomický obor na VŠB-EKF, kde vedl seminář obchodního práva a spolupublikoval knihu o islámském bankovnictví. Již tehdy projevoval talent pro generování nápadů – od geniálních až po nesmyslné – ale vždy dokázal nadchnout své okolí. Po studiu pracoval jako metodik v SFŽP, aby vystřídal klidný život úředníka za řízení oddělení článků v Alze.

Print
P-DC1-WEB21