Jak snizit naklady na AI

Aktualizováno: 17. června 2026 • Autor: Václav Závada

V červnu 2026 došlo ve světě digitálních služeb k bezprecedentní události: americká vláda nařídila Anthropicu, aby zablokoval přístup k modelům Fable 5 a Mythos 5 všem cizím státním příslušníkům, a ten je plošně vypnul – mnoho evropských firem i jednotlivců se tak poprvé setkalo s rizikem, které bylo dosud pouze teoretické: u cloudové AI nezáleží jen na kvalitě a ceně modelu, ale také na tom, na čí infrastruktuře běží a kdo má pravomoc ji vypnout.

Proč Anthropic vypnul Fable 5 a Mythos 5?

Oficiálním důvodem byla národní bezpečnost – podle amerických úřadů se objevil způsob, jak obejít ochranná opatření modelu a dostat se k jeho nejcitlivějším schopnostem, zejména v kybernetické oblasti. Pozornost ale budí forma zásahu: nešlo o plošné stažení kvůli vadě, ale o exportní příkaz mířený na cizí státní příslušníky. To napovídá, že USA začínají s nejvýkonnějšími modely zacházet jako se strategickou technologií, kterou je třeba upřít cizím aktérům – podobně jako dříve u pokročilých čipů.

Obě strany navíc líčí věc jinak a přístup k modelům je zatím jen pozastavený, ne nutně natrvalo. Jisté je hlavně jedno: že se to vůbec stalo.

Zdroj: Statement on the US government directive to suspend access to Fable 5 and Mythos 5 (Tisková zpráva společnosti Anthropic)

Proč přemýšlet o lokální AI – OBSAH

Slovník AI pojmů
Nejlepší AI model byl zakázán. Co to říká o cloudové závislosti?
Ne každá úloha potřebuje špičkový AI model
Lokální AI? Ušetříte a nikdo vám ji nevypne
Rozumná míra digitální soběstačnosti
Vlastní AI: dnes stačí jeden výkonný počítač
Jak rozdělit práci mezi lokální AI a cloud

Slovník AI pojmů

Co je cloudová AI?

AI model, ke kterému přistupujete přes internet. Běží na serverech poskytovatele – OpenAI, Anthropic, Google a dalších – a platíte za jeho používání.

Nevyžaduje vlastní hardware, ale vaše data při každém dotazu opouštějí vaše zařízení a míří na cizí infrastrukturu.

Co je lokální AI model?

AI model nainstalovaný a spuštěný přímo na vašem hardwaru. Data nemusejí opouštět vaši síť, pokud je tak systém navržený.

Platíte jednorázově za hardware a průběžně za jeho provoz – ne za každé použití modelu. Nevyžaduje stálé připojení k internetu ani souhlas s podmínkami externího poskytovatele.

Proč některé modely smíte provozovat sami (open-weight)?

Některé modely jsou tzv. open-weight: jejich parametry jsou veřejně dostupné ke stažení a podle konkrétní licence je můžete spustit na vlastním hardwaru. Příklady: Llama (Meta), Mistral nebo Qwen. Právě díky tomu je můžete provozovat lokálně, mimo cloud.

Výkonu úplné špičky zatím nedosahují, ale na běžné, rutinní úlohy – klasifikaci, shrnutí, vyhledávání ve vlastních datech – bohatě stačí.

Co je TCO kalkulačka?

Nástroj pro výpočet celkových nákladů na vlastnictví (z angl. Total Cost of Ownership). Zahrnuje pořizovací cenu hardwaru, energie, správu a odpisy.

Umožňuje porovnat jednorázovou investici do vlastní techniky s průběžnými náklady na placení cloudu a zjistit, kde leží váš bod zlomu.

Co znamená compliance v kontextu AI?

Soulad s právními a regulačními požadavky. V kontextu AI jde zejména o GDPR a sektorovou regulaci – v bankovnictví, zdravotnictví nebo energetice.

Pokud zákon zakazuje posílat určitá data do zahraničního cloudu, compliance je binární blokátor: ne otázka ceny, ale zákonnosti.

Nejlepší AI model byl zakázán. Co to říká o cloudové závislosti?

Fable 5 byl v provozu příliš krátce, aby ho firmy stihly ve větším měřítku nasadit. Událost ale upozornila na vzorec, který v cloudovém AI panuje obecně: drtivá většina každodenní rutinní práce běží na drahých špičkových modelech, jejichž výkon tato práce vůbec nevyužije. Lokální AI nabízí smysluplnou odpověď: přesunout opakující se agendu mimo cloud, snížit náklady a cloudové modely nasazovat jen tam, kde jejich výkon skutečně rozhoduje.

Z toho neplyne „přestaňte používat cloud AI" o nic víc než „bojte se ChatGPT". Plyne z toho něco praktičtějšího: příležitost posílit odolnost vlastních procesů a zároveň ušetřit. Cloudové modely typu Claude nebo ChatGPT pak dávejte tam, kde pro vás mají reálnou přidanou hodnotu.

Ne každá úloha potřebuje špičkový AI model

Špičkové AI nástroje jsou skvělé na těžké věci – složitější rozbory, kreativní práci, úkoly, kde rozhoduje hloubka a kde se vyplatí mít to nejlepší, co trh nabízí. Jenže drtivá většina toho, co běžně potřebujete, žádnou špičku nevyžaduje. Sem patří úlohy jako:

shrnout dlouhý dokument nebo článek do pár vět
roztřídit a označit e-maily
najít konkrétní informaci ve vlastních souborech a poznámkách
připravit první verzi textu, který stejně budete upravovat
odpovědět na otázku, která se pořád dokola opakuje

Tady nerozhoduje genialita modelu, ale množství a pravidelnost. A přesně takovou práci dnes zvládnou i lokální modely – tedy AI, která běží mimo cloud, na hardwaru, který ovládáte vy.

I ta nejšpičkovější laboratoř na světě řeší spoustu úplně banálních úkolů, na které jednodušší model bohatě stačí. Volba „lokální AI, nebo špička" tak není o tom, jak velký hráč jste – je o tom, jakou úlohu zrovna řešíte.

Klíčová otázka tedy nezní „lokální, nebo cloud?", ale „jakou úlohu zrovna řeším?". Není to o tom přesunout všechno k sobě – je to jednoduché pravidlo: poslat každou úlohu tam, kam patří. Těžké a výjimečné věci nechte špičce v cloudu; vyplatí se a na vlastní pěst byste je jen těžko zvládli. Tu rutinní, opakovanou práci – které je objemově nejvíc – má smysl nechat běžet na jednodušším a levnějším modelu mimo cloud.

Lokální AI? Ušetříte a nikdo vám ji nevypne

Tohle rozdělení dává smysl ze dvou na sobě nezávislých důvodů. Nejde o jeden hlavní a jeden do počtu – oba stojí samy o sobě.

Přestanete přeplácet. Za jednoduchou, opakovanou práci platíte cenu za nejlepší model na trhu – i když z jeho schopností využijete jen zlomek. Když tahle rutina běží na jednodušším modelu mimo cloud, platíte jen za to, co reálně potřebuje. Drahou špičku pak nasadíte tam, kde opravdu přidává hodnotu, místo abyste ji rozmělnili na tisíce drobností.

A zároveň budete držet víc karet ve vlastní ruce. To, co běží u vás, vám nikdo zvenčí nevypne, nezdraží ze dne na den ani nezruší změnou podmínek. Tohle není o strachu – je to prostě rozumná pozice. Část toho, co používáte, máte plně ve svých rukou, a ta událost z června 2026 je jen názorná připomínka, proč to dává smysl. Co zůstane v cloudu, tam zůstane vědomě, protože se to vyplatí – ne proto, že jste neměli na vybranou.

Rozumná míra digitální soběstačnosti

Jakmile začnete přemýšlet o závislosti na cizí technice, dá se snadno sklouznout do paniky: co když nám vypnou nejen AI, ale i cloud, databáze nebo rovnou operační systém? Tady je dobré dát si pokoj.

Na takový scénář se nepřipravujte. Byla by to katastrofa tak rozsáhlá, že příprava na ni by stála víc, než kolik unesete – a stejně byste si ji koupili leda pár hodin navíc. Takové věci nejsou starost jednotlivce ani jedné firmy, ale státu.

Soustřeďte se na rizika, která lze reálně a nákladově smysluplně ošetřit. Lokální AI do této kategorie spadá: nejčastější rutinní úlohy lze přesunout mimo cloud relativně levně a bez toho, abyste stavěli vlastní datacentrum. Naopak příprava na scénáře typu odstřižení Evropy od amerického cloudu nebo operačních systémů už smysl nedává. Jde o riziko státní, ne firemní.

Mimochodem právě tahle zdrženlivost je dobrý test: nabídka, která vám maluje konec světa a prodává řešení na všechno, vám neříká pravdu.

Vlastní AI: dnes stačí jeden výkonný počítač

Ještě donedávna znamenalo provozovat AI mimo cloud mít serverovnu, IT oddělení a rozpočet, který dával smysl jen velkým firmám. To už neplatí. Výkon, na kterém běžně spustíte schopný model, se dnes vejde do jednoho výkonného AI počítače – a vznikla i celá kategorie kompaktních hotových zařízení „all-in-one", navržených tak, abyste je nemuseli stavět ani spravovat jako server. Zapojíte a běží.

Pro člověka, který se o techniku zajímá, je to možná to nejpřekvapivější na celém příběhu: schopná AI dávno není jen vzdálená služba, ke které se připojujete. Je to čím dál dostupnější věc, kterou můžete provozovat sami.

Možná dnes používáte jen ChatGPT nebo Claude a tím to pro vás končí – a to je úplně v pořádku. Ale jakmile narazíte na práci, kterou děláte pořád dokola, je dobré vědět, že přesunout zrovna ji k sobě je dnes na dosah, ne sci-fi.

Jak výkonný počítač na lokální AI potřebujete?

Rozhoduje hlavně jedna věc – paměť grafické karty (VRAM), u počítačů Mac sdílená paměť. Ne takt procesoru, ne počet jader. Čím víc paměti, tím větší a chytřejší model se do ní vejde. Hrubé vodítko:

8–16 GB grafické paměti (běžná herní karta, např. řada RTX 4060–4080): menší a střední modely zhruba do 14 miliard parametrů – přesně ta třída, která utáhne rutinní úlohy z tohoto článku.
24–32 GB (RTX 4090 nebo 5090), případně Mac s 32–64 GB sdílené paměti: větší modely kolem 30 miliard parametrů, citelně schopnější.
Ty nejnáročnější modely (70 miliard parametrů a výš) chtějí dvě grafické karty, Mac se 128 GB paměti, nebo právě některé z hotových „all-in-one" zařízení typu NVIDIA DGX Spark 4TB.

Dobrá zpráva: na práci, o které je řeč – shrnování, třídění, hledání ve vlastních datech – si bohatě vystačíte s běžným výkonným počítačem. Nic exotického není potřeba.

Jak rozdělit práci mezi lokální AI a cloud

Neposílejte všechnu AI zátěž tam, kde platíte za schopnosti, které většina úloh vůbec nevyužije. Zároveň se ale nespoléhejte výhradně na infrastrukturu, kterou nemáte pod vlastní kontrolou. Rozumným řešením je postupný přesun nejčastější rutinní práce mimo cloud. Ušetříte na úlohách, pro které špičkový model nepotřebujete, a část klíčové kapacity budete mít plně ve svých rukou. Špičkovou AI si v cloudu nechte tam, kde skutečně přidává hodnotu.

Možná vás napadne, že taková úvaha nemá jasný konec. Na zahraniční, převážně americké infrastruktuře dnes nestojí jen špičková AI, ale také cloud, databáze, sítě a další vrstvy digitálního provozu. To je pravda. Právě proto je důležité určit rozumnou hranici. Lokální AI dává smysl tam, kde jde o riziko, které lze ošetřit relativně levně a reálně. Pojistit se proti všemu ostatnímu není ekonomicky proveditelné – a často by to ani nemělo praktický význam. Co je vám platné, že vám jako jedinému všechno běží dál, když se ekonomika kolem zhroutí? Rozumný přístup tedy nevychází z pohodlnosti, ale z výpočtu: ošetřit to, co se ošetřit vyplatí, a za zbytkem se nehnat.

Mohlo by vás zajímat

Kde přesně leží hranice, za kterou se vlastní řešení finančně vyplatí, pomůže určit TCO kalkulačka. Právní, geopolitická a provozní rizika se ale vyčíslují hůře. Tam už nejde jen o cenu, ale hlavně o vaši toleranci k riziku spojenému se závislostí na cizí infrastruktuře.

AI, umělá inteligence AI akcelerátory

Václav Závada

Václav absolvoval ekonomický obor na VŠB-EKF, kde vedl seminář obchodního práva a spolupublikoval knihu o islámském bankovnictví. Již tehdy projevoval talent pro generování nápadů – od geniálních až po nesmyslné – ale vždy dokázal nadchnout své okolí. Po studiu pracoval jako metodik v SFŽP, aby vystřídal klidný život úředníka za řízení oddělení článků v Alze.

Free delivery
Alzaboxes and stores

Intel Arc Pro B70 32GB

Graphics Card - 32GB GDDR6 (19000MHz), Intel ARC Battlemage (BMG-G31, 2280 MHz), Boost 2800 MHz, PCI Express x16 5.0, 256Bit, HDMI 2.1, width 266,7 mm

30,990,-

Buy

In stock > 5 pcs

Order Code: BOpb70a1

SAPPHIRE AMD Radeon AI PRO R9700 32GB - Graphics Card

Free delivery
Alzaboxes and stores

5.0 3×

SAPPHIRE AMD Radeon AI PRO R9700 32GB

Graphics Card - 32GB GDDR6 (20000MHz), AMD Radeon RDNA 4.0 (Navi 48, 1666 MHz), Boost 2920 MHz, PCI Express x16 5.0, 256Bit, DisplayPort 2.1a, width 266,7 mm

38,590,-

Buy

In stock > 5 pcs

Order Code: ELr97ap1

Free delivery
to Alza branch

NVIDIA RTX PRO 6000 96GB Blackwell Max-Q Workstation Edition

Graphics Card - 96GB GDDR7 (28000MHz), NVIDIA Blackwell (GB202, 1590 MHz), Boost 2288 MHz, PCI Express x16 5.0, 512Bit, DisplayPort 2.1b, width 266,7 mm

334,990,-

Buy

In stock 1 pcs

Order Code: NVrpr02

PNY NVIDIA RTX PRO 2000 Blackwell 16GB GDDR7 ECC - Graphics Card

Free delivery
Alzaboxes and stores

PNY NVIDIA RTX PRO 2000 Blackwell 16GB GDDR7 ECC

Graphics Card - 16GB GDDR7 (18000MHz), NVIDIA Blackwell (GB206, 790 MHz), Boost 1950 MHz, PCI Express x16 5.0, 128Bit, mini DisplayPort 2.1, width 167 mm

22,990,-

Buy

In stock > 5 pcs

Order Code: PNYrpb01

3.3 3×

Intel Arc Pro B50 16GB

Graphics Card - 16GB GDDR6 (14000MHz), Intel ARC Battlemage (BMG-G21, 1700 MHz), Boost 2600 MHz, PCI Express x16 5.0, 128Bit, mini DisplayPort 2.1, width 168 mm

10,490,-

Buy

In stock > 5 pcs

Order Code: BOpb50a1

NVIDIA RTX PRO 4500 32GB Blackwell - Graphics Card

Free delivery
Alzaboxes and stores

NVIDIA RTX PRO 4500 32GB Blackwell

Graphics Card - 32GB GDDR7 (28000MHz), NVIDIA Blackwell (GB203, 1590 MHz), Boost 2617 MHz, PCI Express x16 5.0, 256Bit, DisplayPort 2.1b, width 266,7 mm

93,499,-

Buy

In stock > 5 pcs

Order Code: NVrpr05

PNY NVIDIA RTX PRO 4000 SFF Blackwell 24GB GDDR7 ECC - Graphics Card

Free delivery
Alzaboxes and stores

PNY NVIDIA RTX PRO 4000 SFF Blackwell 24GB GDDR7 ECC

Graphics Card - 24GB GDDR7 (18000MHz), NVIDIA Blackwell (GB203, 790 MHz), Boost 1337 MHz, PCI Express x16 5.0, 192Bit, mini DisplayPort 2.1, width 167 mm

55,990,-

Buy

In stock > 5 pcs

Order Code: PNYrpb03

Co odhalil jeden vypnutý model: proč přemýšlet o lokální AI?

Proč Anthropic vypnul Fable 5 a Mythos 5?

Proč přemýšlet o lokální AI – OBSAH

Slovník AI pojmů

Co je cloudová AI?

Co je lokální AI model?

Proč některé modely smíte provozovat sami (open-weight)?

Co je TCO kalkulačka?

Co znamená compliance v kontextu AI?

Nejlepší AI model byl zakázán. Co to říká o cloudové závislosti?

Ne každá úloha potřebuje špičkový AI model

Lokální AI? Ušetříte a nikdo vám ji nevypne

Rozumná míra digitální soběstačnosti

Vlastní AI: dnes stačí jeden výkonný počítač

Jak výkonný počítač na lokální AI potřebujete?

Jak rozdělit práci mezi lokální AI a cloud