Společnost OpenAI oznámila uvedení svého nejnovějšího modelu o3 mini a jeho výkonnější verze o3 mini high. Nový model přináší významné zlepšení v oblasti programování, matematiky a logických úloh a je dostupný zdarma ve službě ChatGPT. Placené verze umožňují přístup k vyšší výpočetní kapacitě a ta bezplatná má určitá omezení. Jaké jsou hlavní novinky tohoto modelu a jak si vede oproti konkurentům jako DeepSeek R1 či Claude 3.5 Sonnet?
OpenAI uvádí, že o3 mini přináší rychlejší odpovědi než jeho předchůdce o1 mini a zároveň dosahuje vyšší přesnosti. Model je navržen tak, aby exceloval v úlohách vyžadujících krokové logické uvažování, což zahrnuje například složité matematické problémy nebo analýzu programového kódu. Zároveň obsahuje tzv. „řetězec myšlení“, což znamená, že model při odpovědi reflektuje vlastní úvahy a dokáže jasně vysvětlit svůj postup.
Tento princip spočívá v tom, že model nejprve rozdělí problém na menší kroky, analyzuje jednotlivé části samostatně, provede vnitřní výpočty a poté na základě této postupné analýzy sestaví finální odpověď. Díky tomu lze lépe pochopit, jak AI dospěla ke svému závěru, a zároveň se zvyšuje přesnost a konzistence odpovědí.
Podle benchmarkových testů OpenAI model o3 mini odpovídá až o 24 % rychleji než o1 mini a v řadě úloh dosahuje vyšší přesnosti. Mezi placenými verzemi je pak k dispozici i o3 mini high, který je optimalizovaný pro složité programátorské a logické úlohy.
V praxi se toto zlepšení projeví například při řešení složitých matematických úloh, kde model nyní dokáže efektivněji rozkládat problémy na jednotlivé kroky a eliminovat chyby v mezivýpočtech. Uživatelé rovněž ocení vyšší přesnost v generování kódu, což znamená méně nutných oprav a ladění. Při běžném používání ChatGPT se o3 mini osvědčuje i v rychlejším poskytování souhrnných odpovědí na komplexní otázky, jako jsou vědecká vysvětlení nebo podrobné analýzy různých témat.
O3 mini high se ukázal jako nejvýkonnější model pro kódování v současnosti. Podle LiveBench dosahuje skóre 82,74, což výrazně převyšuje výkonnost DeepSeek R1 (66,74), Claude 3.5 Sonnet (67,13) i staršího modelu OpenAI o1 (69,69). I na dalších platformách a benchmarcích model dosahuje výjimečné výsledky a řadí se mezi nejlepší programátory na světě.
Model | Celkový průměr | Logické uvažování | Tvorba kódu | Matematika | Analýza dat | Jazyk | Dodržení instrukcí |
---|---|---|---|---|---|---|---|
o3 mini high
(31.1.2025) OpenAI |
75.88 ✓ | 89.58 | 82.74 ✓ | 77.29 | 70.64 ✓ | 50.68 | 84.36 |
o1 high
(17.12.2024) OpenAI |
75.67 | 91.58 ✓ | 69.69 | 80.32 | 65.47 | 65.39 ✓ | 81.55 |
Deepseek R1 | 71.57 | 83.17 | 66.74 | 80.71 ✓ | 69.78 | 48.53 | 80.51 |
o3 mini
(31.1.2025 medium) OpenAI |
70.01 | 86.33 | 65.38 | 72.37 | 66.56 | 46.26 | 83.16 |
Gemini 2.0 Flash
(thinking exp 01-21) |
66.92 | 78.17 | 53.49 | 75.85 | 69.37 | 42.18 | 82.47 |
Gemini 2.0 Pro
(exp 02-05) |
65.13 | 60.08 | 63.49 | 70.97 | 68.02 | 44.85 | 83.38 |
Gemini
(exp 1206) |
64.09 | 57.00 | 63.41 | 72.36 | 63.16 | 51.29 | 77.34 |
o3 mini
(31.01.2025 low) OpenAI |
62.45 | 69.83 | 61.46 | 63.06 | 62.04 | 38.25 | 80.06 |
Gemini
2.0 flash |
61.47 | 55.25 | 53.92 | 65.62 | 67.55 | 40.69 | 85.79 ✓ |
Deepseek v3 DeepSeek |
60.45 | 56.75 | 61.77 | 60.54 | 60.94 | 47.48 | 75.25 |
Gemini 2.0 flash
(exp) |
59.26 | 59.08 | 54.36 | 60.39 | 61.67 | 38.22 | 81.86 |
Claude 3.5 Sonnet
(22.10.2024) Anthropic |
59.03 | 56.67 | 67.13 | 52.28 | 55.03 | 53.76 | 69.30 |
ChatGPT 4o
(29.1.2025) OpenAI |
57.79 | 57.92 | 60.56 | 48.02 | 66.00 | 49.14 | 65.07 |
Porovnání o3 mini a o3 mini high s modely jako Gemini, DeepSeek a Claude. Zdroj: LiveBench.
Ačkoli je novinka vysoce efektivní v programování a matematických úlohách, její využití se neomezuje pouze na technické obory. O3 mini je vhodný i pro běžné uživatele, kteří hledají rychlé a přesné odpovědi na každodenní otázky, ať už jde o plánování, vzdělávání, nebo obecné znalosti. Například při vyhledávání doporučení ohledně kariéry, financí nebo osobního rozvoje model poskytuje jasné a strukturované odpovědi, které jsou snadno srozumitelné.
Navíc díky schopnosti analyzovat složitější texty a poskytovat přehledná shrnutí je o3 mini skvělým nástrojem pro studenty, kteří potřebují rychlé porozumění komplikovaným tématům nebo pomoc s psaním textů.
V přímém porovnání s čínským DeepSeek R1, který byl nedávno uveden jako bezplatný model s důrazem na uvažování, se ukazuje zásadní rozdíl v přístupu k odpovědím. Zatímco o3 mini poskytuje stručnější a jasně strukturované odpovědi s náhledem do své logiky, DeepSeek R1 nabízí rozsáhlejší uvažovací proces, ve kterém uživateli ukazuje své pochybnosti a možnosti alternativních přístupů.
Například při otázce, zda je lepší jít na univerzitu nebo rovnou do práce, o3 mini nejprve vyhodnotí faktory jako zájmy, finanční situaci a budoucí trh práce, a následně poskytne souhrnnou analýzu. DeepSeek R1 oproti tomu rozpracuje svůj myšlenkový proces do většího detailu, přičemž častěji zvažuje více hypotetických scénářů a možné protichůdné argumenty.
Výsledky nezávislých testů ukazují, že o3 mini poskytuje jasnější a přímější odpovědi s transparentním vysvětlením svého postupu, zatímco DeepSeek R1 se více zaměřuje na širší kontext, možné nuance a otevřenější analýzu rozhodovacího procesu.
i
Mohlo by vás zajímat
O3 mini je poprvé dostupný i pro neplatící uživatele ChatGPT. V bezplatné verzi jej lze aktivovat tlačítkem „Mysli“ v chatu. Pro uživatele Plus a Team platí limit 150 zpráv denně, zatímco předplatitelé Pro (cca 5 000 Kč měsíčně) získají neomezený přístup k o3 mini a o3 mini high.
Poskytovatel | Název plánu | Cena | Klíčové vlastnosti |
---|---|---|---|
OpenAI | Free | 0 USD | GPT‑4o mini zdarma, navíc omezený přístup k verzím GPT‑4o a o3‑mini, stejně jako k funkcím nahrávání souborů, analýzy dat, generování obrázků a hlasového režimu. |
ChatGPT Plus | 20 USD | Vše z Free verze, přístup k o1 a o3-mini. Vyšší limity na analýzy, zprávy, nahrávání souborů, generování obrázků a hlasový režim. | |
ChatGPT Pro | 200 USD | Určeno pro pokročilé uživatele – téměř neomezený přístup, vyšší výpočetní výkon, pokročilý hlasový režim, apod. | |
Google (Gemini) | Gemini Standard | Zdarma | Přístup k základním modelům Gemini 2.0 Flash a Flash Thinking Experimental, možnost propojit s dalšími aplikacemi Google. |
Gemini Advanced / Google One AI Premium | ~20 USD | Plná verze (Gemini 2.0 Pro) s rozšířeným kontextovým oknem (až 1 milion tokenů), přednostní přístup k novým funkcím, integrace s Google Workspace a 2 TB cloudového úložiště. | |
Anthropic (Claude) | Claude Free | Zdarma | Základní přístup k Claude s omezeným denním počtem zpráv (cca 30–50 zpráv/den), vhodný pro začátečníky. |
Claude Pro | 20 USD | Vyšší limity, přístup k pokročilejším modelům (např. Claude 3 Opus), přednostní přístup k novinkám. | |
DeepSeek | DeepSeek (R1) | Zdarma | Zdarma, vhodná pro osobní použití, občasné problémy se stabilitou (přetížení serverů). |
i
Aktuální k únoru 2025, nabídka funkcí a modelů se pravidelně mění. Pro přehlednost jsme uvedli pouze základní cenu při pravidelné měsíční platbě. Při volbě ročního předplatného lze získat nižší cenu. Současně náš seznam neobsahuje firemní plány.
Aktuální informace k cenovým plánům viz Google Gemini, OpenAI ChatGPT, Anthropic Claude.
Bezplatná verze má však oproti placeným variantám také další omezení. Například přístup k výkonnější verzi o3 mini high je exkluzivní pouze pro platící uživatele. Dále se mohou lišit dostupné funkce, latence odpovědí a priorita serverů, což znamená, že bezplatní uživatelé mohou občas zaznamenat pomalejší dobu odezvy.
Model je rovněž dostupný v OpenAI API a integruje se do Microsoft Azure OpenAI Service, GitHub Copilot a dalších nástrojů společnosti Microsoft.
Uvedení modelu o3 mini představuje zásadní krok vpřed v oblasti modelů pro logické uvažování a kódování. Díky rychlým odpovědím, pokročilému logickému myšlení a přesnosti v programátorských úlohách se jedná o nejsilnější model v této kategorii.
i
Mohlo by vás zajímat
Navíc jeho dostupnost v bezplatné verzi umožňuje širokému spektru uživatelů využít jeho schopnosti i mimo technické obory. Konkurence v podobě DeepSeek-R1 sice nabízí rozsáhlejší odpovědi, ale o3 mini naopak poskytuje strukturovanější a transparentnější náhled na svůj vlastní uvažovací proces. S volně dostupnou verzí v ChatGPT má nyní každý možnost otestovat schopnosti tohoto modelu na vlastní kůži.