Anthropic vydává Claude Opus 4.8: ostřejší úsudek, vyšší upřímnost a Dynamic Workflows
Pouhých 41 dní po verzi 4.7 přichází Claude Opus 4.8. Anthropic slibuje lepší úsudek, vyšší upřímnost o vlastní práci a novou funkci Dynamic Workflows pro koordinaci stovek paralelních subagentů — za stejnou cenu jako předchůdce.
Anthropic dnes vydal nový vlajkový model Claude Opus 4.8, a to pouhých 41 dní po předchozím Opus 4.7. Tak rychlé tempo aktualizací je pro Anthropic neobvyklé a podtrhuje, jak ostrý je dnes souboj na špičce mezi Anthropicem, OpenAI a Googlem. Hlavní příběh tentokrát není o syrovém výkonu, ale o spolehlivosti a úsudku — tedy přesně o tom, na čem stojí nasazení AI do reálné produkce.
Lepší úsudek a vyšší upřímnost
Anthropic popisuje Opus 4.8 jako model s "ostřejším úsudkem, větší upřímností ohledně vlastního postupu a schopností pracovat samostatně déle než předchůdci". V praxi to znamená dvě věci, které vývojáři ocení nejvíc:
- Model častěji přizná nejistotu a méně často tvrdí něco, co nemá podloženo daty.
- Sám od sebe upozorňuje na problémy ve vstupech i výstupech analýzy — místo aby tiše pokračoval s vadným zadáním.
Podle interních evaluací je Opus 4.8 přibližně čtyřikrát méně náchylný k tomu, aby přehlédl chybu ve vlastním vygenerovaném kódu, než jeho předchůdce. To je u agentního programování zásadní — právě tiché chyby v kódu jsou to, co v produkci nejvíc bolí.
Benchmarky a cena
Podle Anthropicu se skóre v klíčových disciplínách posunulo takto:
- Agentní programování: z 64,3 % na 69,2 %
- Multioborové uvažování s nástroji: z 54,7 % na 57,9 %
Dobrá zpráva pro rozpočty: cena zůstává stejná jako u Opus 4.7. Dostáváte tedy lepší model za stejné peníze — což u frontier modelů není samozřejmost.
Dynamic Workflows: stovky subagentů najednou
Největší novinkou je funkce Dynamic Workflows, dostupná zatím v research preview. Je navržená tak, aby větším modelům jako Opus pomohla koordinovat stovky paralelních subagentů u skutečně komplexních úkolů. Anthropic uvádí konkrétní příklad: Claude Code spolu s Opus 4.8 dnes zvládne migraci celé codebase přes statisíce řádků kódu — od zadání až po merge.
Přesně tímhle směrem se posouvá naše práce v Convenient.Solutions: od jednoho promptu k orchestraci mnoha specializovaných agentů, kteří si práci rozdělí, navzájem se ověří a doručí výsledek, na který se dá spolehnout.
A co bude dál? Mythos
Anthropic na závěr potvrdil, že pracuje na bezpečnostních pojistkách pro silnější rodinu modelů a očekává, že "v nadcházejících týdnech zpřístupní modely třídy Mythos všem zákazníkům". Laťka se tedy zase posune.
Mimochodem — tenhle článek vám sepsal právě Claude Opus 4.8. Vyšší upřímnost v praxi: ano, je to trochu zaujaté. 🙂
Kurátorsky, na základě veřejných zdrojů a kontextu našeho stacku. Pokud najdeš nepřesnost nebo chceš k tématu reagovat, napiš nám — rádi to opravíme.
Související
Máte nápad?
Vytvořme ho spolu.
Napište nám pár vět o tom, co chcete postavit či vytvořit. Do dvou pracovních dnů se ozveme s první bezplatnou konzultací.
