Try our cookies Alza.cz a. s., Company identification number 27082440, use cookies and other data to ensure the proper functioning of the website and, with your consent, also, among other things, to personalize advertising and the content of our websites. By clicking on the “I understand“ button, you agree to the use of cookies and the transfer of data regarding the behavior on the website for displaying targeted advertising on social networks and advertising networks on other websites.
Alzak icon

TCO kalkulačka: za jak dlouho se vlastní infrastruktura vrátí oproti cloudu

Article

• Tipy 

• Autor: Peter Vnuk

Cloud dostane firemní AI do provozu rychle, ale pravidelná spotřeba potřebuje finanční kontrolu. Jakmile interní asistenti, práce s dokumenty nebo vývoj agentů vytvářejí podobný účet každý měsíc, přestává stačit otázka, kolik stojí jednotlivý dotaz. Důležitější je, za kolik měsíců by se stejná zátěž zaplatila na vlastním zařízení.

AI server vs Cloud

Cena zařízení sama o sobě nic nerozhodne

Při prvním pohledu působí vlastní AI infrastruktura draze, protože se její cena objeví najednou. Cloud se naopak rozpadá do měsíčních plateb, které méně bolí v rozpočtu, ale v delším horizontu mohou vyrůst do výrazně vyšší částky. TCO výpočet obě varianty srovná na stejné časové ose: jednorázový nákup a provoz proti opakované cloudové spotřebě.

Do cloudové části patří celý účet za AI provoz, nikoli jen cena modelu. Firemní řešení obvykle platí také za práci s dokumenty, uložení dat, vyhledávací vrstvu, logování a monitoring. U menšího pilotu jde o vedlejší položky, ale u stabilního nasazení umí posunout návratnost vlastního zařízení o měsíce.

U lokální infrastruktury nestačí dosadit pořizovací cenu. Firma musí počítat také elektřinu, základní správu, servisní rezervu a čas IT týmu při nasazení. Přesun části zátěže z cloudu navíc může vyžadovat dodatečnou jednorázovou práci: nastavení prostředí, úpravu datových toků a ověření bezpečnostních pravidel.

Nákladová položka Cloudový provoz Vlastní infrastruktura
Základ výpočtu měsíční účet za AI služby pořizovací cena zařízení
Pravidelná režie služby okolo modelu a monitoring elektřina a správa
Jednorázová práce obvykle nižší při startu nasazení, integrace, bezpečnostní nastavení
Hlavní finanční riziko růst spotřeby bez pevného stropu nevyužitá kapacita po nákupu
Nejvhodnější použití rychlé ověření scénáře opakovaný provoz nad známou zátěží

Bod návratnosti se dá spočítat jednou rovnicí

Pro modelový výpočet použijeme pracovní stanici NVIDIA DGX Spark 4TB s pořizovací cenou 125 990 Kč. Jde o lokální AI pracovní stanici se 128 GB paměti, 4TB SSD a výkonem až 1 PFLOP při FP4 inferenci se sparsity. Díky známé pořizovací ceně se na ní dá dobře ukázat, jak se návratnost mění podle velikosti pravidelného cloudového účtu.

i

Bod návratnosti v měsících = (pořizovací cena zařízení + jednorázové náklady na nasazení) ÷ (měsíční cloudové náklady – měsíční provoz vlastní infrastruktury)

Při měsíční cloudové spotřebě 25 000 Kč a modelovém lokálním provozu 2 500 Kč vychází návratnost přibližně na 5,6 měsíce. Pokud stejná firma platí za cloud 10 000 Kč měsíčně, návratnost se prodlouží na 16,8 měsíce. Rozdíl nevzniká z ceny zařízení, ale z toho, kolik opakované práce dokáže převzít.

Měsíční cloudový účet Modelový lokální provoz Návratnost při ceně 125 990 Kč
10 000 Kč 2 500 Kč 16,8 měsíce
15 000 Kč 2 500 Kč 10,1 měsíce
25 000 Kč 2 500 Kč 5,6 měsíce
40 000 Kč 2 500 Kč 3,4 měsíce

Tabulka ukazuje základní model s pořizovací cenou zařízení a pravidelným lokálním provozem. Pokud firma započítá také jednorázovou práci při nasazení, například nastavení prostředí, úpravu datových toků nebo bezpečnostní ověření, přičte ji ke vstupní investici a bod návratnosti se prodlouží. Například při jednorázových nákladech 50 000 Kč by se návratnost u cloudové spotřeby 25 000 Kč měsíčně posunula z 5,6 měsíce na přibližně 7,8 měsíce.

Tato tabulka je vhodnější podklad pro schválení než obecná debata o cloudu a hardwaru. U nízké spotřeby ještě nákup nemusí vycházet přesvědčivě, zvlášť pokud firma teprve hledá vhodné AI scénáře. Jakmile se měsíční účet pohybuje v nižších desítkách tisíc korun a využití má jasný rytmus, investice už dostává konkrétní horizont návratnosti.

Lokální AI stanice má největší hodnotu u opakované práce

NVIDIA DGX Spark míří na firmy a týmy, které chtějí lokálně provozovat nebo testovat větší AI modely bez neustálého nárůstu cloudových nákladů. Hodí se pro interní asistenty nad firemní dokumentací, vývoj agentů, testování otevřených modelů a práci s daty, která mají zůstat pod kontrolou firmy. Důležitá je hlavně kombinace vysoké kapacity paměti, kompaktního provedení a hotového softwarového prostředí.

Kapacita 128 GB paměti je u této kategorie důležitější než běžný procesorový výkon. Lokální AI úlohy totiž často narážejí právě na paměť a velikost modelu, nikoli na to, zda zařízení zvládne kancelářskou práci. V praxi proto jde o vyhrazený uzel pro AI zátěž, kterou firma dokáže opakovaně využít.

U takového nákupu je potřeba sledovat dvě hranice. První je návratnost při současné spotřebě, druhá návratnost při realistickém růstu. Pokud se AI po úspěšném pilotu rozšíří do dalšího týmu, cloudový účet poroste okamžitě, zatímco vlastní zařízení už bude v rozpočtu jednou zaplacené, což může být v konečném důsledku zásadní finanční rozdíl.

Kde se výpočet nejčastěji pokazí

TCO kalkulace bývá nepřesná hlavně tehdy, když vychází z optimistických vstupů. Firma podcení čas IT týmu, zapomene na monitoring nebo počítá s využitím, které se nakonec nepotvrdí. Konzervativnější scénář je pro schvalování užitečnější než tabulka, která ukáže krásnou návratnost jen proto, že do ní někdo nedal celé náklady.

Vstup do kalkulace Častá chyba Lepší postup
Měsíční cloudový účet počítá se jen cena modelu zahrnout i okolní služby a monitoring
Lokální provoz elektřina se započítá, správa ne přidat měsíční rezervu na IT čas
IT kapacita počítá se s tím, že správu někdo zvládne mimochodem ověřit, zda má firma člověka na nasazení, aktualizace a průběžný dohled
Jednorázové nasazení migrace se bere jako samozřejmost dát ji do prvotního nákladu projektu
Využití zařízení počítá se ideální vytížení pracovat i se slabším scénářem
Budoucí růst ignoruje se rozšíření do dalších týmů spočítat variantu za 6 až 12 měsíců
Flexibilita cloud se bere jen jako náklad ocenit možnost rychle snížit spotřebu

Riziko vázaného kapitálu patří do výpočtu stejně jako cena zařízení. Pokud se plánované využití nepotvrdí, lokální stanice bude část času stát, zatímco cloud by šel jednoduše omezit. Právě proto má kalkulace pracovat nejen se základním scénářem, ale také s konzervativní variantou, která ukáže, zda nákup obstojí i při pomalejším rozjezdu.

Kdy pracovní stanice přestává stačit

Lokální AI pracovní stanice je dobrý první krok ve chvíli, kdy firma potřebuje převzít stabilní část cloudové zátěže a získat vlastní prostředí pro vývoj, inferenci nebo práci s interními daty. U větších nasazení ale může začít narážet na limity výkonu, paměti, dostupnosti nebo správy pro více týmů. V tu chvíli už nejde jen o nákup jednoho zařízení, ale o návrh širší AI infrastruktury podle konkrétního provozu.

Mezistupněm může být více samostatných pracovních stanic stejné třídy, pokud firma potřebuje oddělit týmy, projekty nebo paralelní úlohy. Ekonomicky se takový scénář počítá podle počtu zařízení a jejich provozních nákladů, technicky ale nejde o automatické spojení výkonu a paměti do jednoho většího systému. Více stanic má opodstatnění hlavně tam, kde lze zátěž rozdělit; pro jeden velký centrální AI provoz je vhodnější individuální návrh vyšší infrastruktury.

Rozhodující signál je objem zátěže. Pokud firma dlouhodobě platí za AI provoz stovky tisíc korun měsíčně, pracuje s více týmy a potřebuje oddělená prostředí, dává smysl připravit individuální kalkulaci vyšší infrastruktury. Základní vzorec návratnosti zůstává stejný, ale do výpočtu se už dosazuje konkrétní nabídka, přesnější odhad provozních nákladů a část cloudové spotřeby, kterou má nové řešení převzít.

U nižších částek je přesvědčivější začít naceněnou pracovní stanicí a měřit skutečné vytížení. Firma tím získá vlastní data o výkonu, provozu i využití, takže případné rozšíření infrastruktury později nestojí na odhadu, ale na reálném provozu.

Spočítejte si vlastní návratnost

Pro první orientaci stačí pracovat se čtyřmi čísly:

  • pořizovací cenou zařízení,
  • aktuálním měsíčním cloudovým účtem,
  • odhadem lokálního provozu
  • a jednorázovou prací při nasazení.

Výsledek pak ukáže bod návratnosti v měsících a rozdíl proti cloudu v tříletém horizontu. Právě tři roky jsou pro firemní hardware praktický horizont, protože lépe vystihují životnost zařízení než jednorázové srovnání s jednou fakturou.

Výsledek výpočtu Co znamená Doporučený další krok
Návratnost do 12 měsíců silný ekonomický signál pro nákup ověřit technické parametry zařízení a připravit schválení
Návratnost 12 až 24 měsíců hraniční pásmo, kde rozhodují další faktory započítat růst využití, bezpečnost dat a dostupnost IT kapacity
Návratnost nad 24 měsíců samotná úspora zatím nemusí nákup obhájit dál měřit cloudový účet a vrátit se k výpočtu po nárůstu zátěže
Záporná nebo nulová úspora lokální provoz nevychází levněji než cloud ponechat scénář v cloudu nebo změnit vstupy výpočtu

Návratnost pod 12 měsíců je silný signál pro nákup, pokud lokální zařízení technicky zvládne požadovanou zátěž. Výsledek mezi 12 a 24 měsíci už stojí na dalších faktorech, hlavně na práci s citlivými daty a očekávaném růstu AI využití. Delší horizont nemusí nákup automaticky vylučovat, ale vyžaduje jasný důvod mimo samotnou úsporu, například interní bezpečnostní pravidla nebo potřebu lokálního vývoje.

Kdy se vlastní AI infrastruktura začne vyplácet

Při cloudové spotřebě 25 000 Kč měsíčně a modelovém lokálním provozu 2 500 Kč se zařízení za 125 990 Kč vrátí přibližně za 5,6 měsíce. Při 15 000 Kč měsíčně se návratnost posouvá zhruba na deset měsíců, což je stále horizont, který už stojí za rozpočtovou debatu. Rozhodující není samotná pořizovací cena, ale rozdíl mezi opakovanou cloudovou platbou a provozem vlastní kapacity.

Dalším krokem je vzít poslední cloudové faktury, oddělit opakovanou AI zátěž od nárazových experimentů a dosadit do výpočtu konkrétní zařízení. Pokud výsledek vychází v řádu měsíců, firma má jasný podklad pro nákup lokální AI pracovní stanice. Pokud čísla zatím nevycházejí, vyplatí se dál sledovat měsíční cloudový účet, počet aktivních uživatelů a podíl opakované zátěže, protože právě tyto hodnoty nejrychleji ukážou, kdy se nákup vlastní AI infrastruktury stane ekonomicky obhajitelným.

i

Upozornění: Číselné údaje v článku jsou orientační a mohou se v průběhu času měnit.

Ondřej Chabr

Peter Vnuk

Technologie jsou pro mě práce i zábava – nejvíc se věnuji smartphonům, notebookům, audiotechnice, umělé inteligenci a všemu hi-tech. Rád recenzuji novinky, sleduji futuristické trendy a odhaduji další vývoj technologií. Fascinuje mě sci-fi a vize budoucího světa, které často inspirují i reálný technologický pokrok. Profesionálně se věnuji také videohrám a hernímu průmyslu. Když zrovna nepracuji, rád si odpočinu u dobré hry, kvalitního piva nebo tvorbou technologických memes na Facebooku.

Print
P-DC1-WEB02