Na trhu panuje absolutní hlad po AI akcelerátorech, které tlačí cenu špičkových řešení od Nvidie až k milionu korun za kus. To nesmírně prodražuje budování rozsáhlých datacenter pro strojové učení, ale také možnost budovat si firemní servery určené pro provoz pokročilých modelů, takže se pracuje na alternativních čipech a řešení.
O vlastní akcelerátory usiluje především AMD, která nabízí AI akcelerátory založené na architektuře APU (Accelerated Processing Unit), které kombinují klasické procesory s tenzorovými jednotkami. Jde o rodinu akcelerátorů AMD Instinct MI 300, která se nabízí ve dvou variantách, Instinct MI 300A pro efektivní provoz modelů umělé inteligence a Instinct MI 300X pro strojové učení.
Procesory AMD Instinct MI 300A jsou určené pro budování vysoce výkonných a škálovatelných počítačových center, přičemž každý procesor má k dispozici 128 GB vlastní rychlé integrované paměti. Obsahuje 912 jednotek pro maticové výpočty, 24 jader založených na architektuře Zen 4 a také Infinity Architecture pro vysokorychlostní komunikaci s celou sítí podobných procesorů.
Procesory AMD Instinct MI 300X jsou optimalizovány pro strojové učení a pro generativní AI, přičemž využívají vlastních 192 GB paměti s extrémní propustností 5,3 TB/s. Obsahuje 1216 jednotek pro maticové výpočty a osm AMD CDNA 3 chipletů, tedy v podstatě modifikovaných jednotek grafických čipů obsahujících 304 výpočetních jednotek a 19456 stream procesorů, které jsou schopné provádět velice rychle paralelní operace na obrovském množství dat.
AMD vlastně zúročuje léta zkušeností jak s chipletovou architekturou (integrací velkého množství jednotlivých křemíkových čipů do jediného pouzdra) a také zkušenosti s designem grafických karet s jejich výpočetními jednotkami a přístupem do sdílené paměti, které dovolují masivní paralelizaci výpočtů.
Procesory rodiny AMD Instinct MI 300 kombinují technologicky i filozoficky to nejlepší, čeho AMD dosáhlo – a to v podobě snadno škálovatelného řešení, takže z těchto čipů je možné stavět datacentra takové velikosti, která je třeba buď pro učení velkých modelů, nebo naopak jejich efektivní provoz.
O vlastní AI procesory usiluje i OpenAI a také Microsoft, protože mít vlastní procesory jim dovolí být nezávislý na dodávkách třetích stran a také by to mohlo snížit náklady na budování velkých datacenter. OpenAI a Microsoft přitom nedávno oznámili záměr investovat až 115 miliard USD do stavby superpočítače pro umělou inteligenci, který by se měl jmenovat „Stargate“ a měl by být postaven na americkém území.
Není známo mnoho detailů, například zda hodlají využít řešení Nvidie a nebo zda v ceně zahrnují i vývoj vlastních čipů. Ven se ale dostala informace, že u tohoto superpočítače uvažují o příkonu až několika gigawattů a že zvažují stavbu vlastního, možná jaderného, zdroje pro jeho napájení.
Microsoft sám pracuje na vlastních architekturách, jako je Microsoft Azure Maia 100 a Microsoft Azure Cobalt 100. Procesor Cobalt je vysoce efektivní procesor pro datacentra poskytující služby Microsoft Azure, je založen na čipu se 128 jádry na architektuře ARM Neoverse N2 a má dvanáctikanálový řadič paměti. Je určen primárně pro provoz virtuálních strojů v cloudu s tím, že by měl dovolit efektivní a úsporný chod.
Microsoft Azure Maia 100 je specializovaný akcelerátor umělé inteligence. Má 105 miliard tranzistorů a využívá špičkový 5 nm proces. Detaily o jeho architektuře nejsou známé, podle informací Microsoftu je tento čip vyvíjen ve spolupráci s OpenAI, která má rozsáhlé zkušenosti s jejich modely GPT a je tedy možné, že jde o čip vyvíjený tak trochu na míru jejich potřebám.
V neposlední řadě nesmíme zapomínat ani na Čínu, která je uprostřed obchodní války s USA, ale nemíní zaostávat v otázkách vývoje umělé inteligence. Čínský výrobce Intellifusion oznámil, že uvede AI čip označovaný jako DeepEdge 10, založený na jejich vlastní neuroakcelerátorové architektuře NNP400T, který by měl nabízet výkon 48 TOPS (tera operací za sekundu) a to za cenu 1000 yuanů (140 USD). Je založen na 14 nm procesu, který zaostává oproti západním špičkovým procesům a výkon je rovněž pomalejší, ale dorovnává to právě cenou, která je velmi významně nižší než u špičkových AI akcelerátorů.
Čínský výrobce se snaží „čipem o 90% levnějším než konkurence pokrýt 90% scénářů“, což je rozhodně zajímavý cíl. Tento čip se vejde do specifikace Microsoftu AI PC, která žádá výkon neuroakcelerátoru alespoň 40 TOPS. Nutno ale poznamenat, že se očekává, že podobných výkonů by měl dosáhnout například i Snapdragon X Elite, který by se měl objevit v průběhu roku 2024, takže bychom podobných výkonů měli dosáhnout i u ultraportable PC, tabletů a špičkových telefonů.
i
Další seriály Michala Rybka na Alza.cz
V kontextu rostoucího zájmu o umělou inteligenci a vysoké poptávky po AI akcelerátorech se objevují nové alternativy k dominantním řešením, jako jsou ty od Nvidie. AMD, Microsoft, OpenAI, a dokonce i čínské společnosti jako Intellifusion, představují vlastní inovativní čipy a akcelerátory zaměřené na zvýšení výpočetní efektivity a snížení nákladů na AI výpočty. Tento trend ukazuje na diverzifikaci trhu s AI hardwarem a na snahu o vytvoření udržitelnějších a cenově dostupnějších řešení pro budování datacenter a rozvoj AI technologií.
Michal Rybka
Michal Rybka je publicista a nadšenec s 20 lety zkušeností v IT a gamingu. Je kurátorem AlzaMuzea a YouTube kanálu AlzaTech. Napsal několik fantasy a sci-fi povídek, které vyšly v knižní podobě, a pravidelně pokrývá páteční obsah na internetovém magazínu PCTuning.