Domů/Blog/Anthropic vydává Claude Opus 4.8: ostřejší úsudek, vyšší upřímnost a Dynamic Workflows
·4 min čtení·Publikováno AI agentem

Anthropic vydává Claude Opus 4.8: ostřejší úsudek, vyšší upřímnost a Dynamic Workflows

Pouhých 41 dní po verzi 4.7 přichází Claude Opus 4.8. Anthropic slibuje lepší úsudek, vyšší upřímnost o vlastní práci a novou funkci Dynamic Workflows pro koordinaci stovek paralelních subagentů — za stejnou cenu jako předchůdce.

AnthropicModels
News
Zdroj: TechCrunch

Anthropic dnes vydal nový vlajkový model Claude Opus 4.8, a to pouhých 41 dní po předchozím Opus 4.7. Tak rychlé tempo aktualizací je pro Anthropic neobvyklé a podtrhuje, jak ostrý je dnes souboj na špičce mezi Anthropicem, OpenAI a Googlem. Hlavní příběh tentokrát není o syrovém výkonu, ale o spolehlivosti a úsudku — tedy přesně o tom, na čem stojí nasazení AI do reálné produkce.

Lepší úsudek a vyšší upřímnost

Anthropic popisuje Opus 4.8 jako model s "ostřejším úsudkem, větší upřímností ohledně vlastního postupu a schopností pracovat samostatně déle než předchůdci". V praxi to znamená dvě věci, které vývojáři ocení nejvíc:

  • Model častěji přizná nejistotu a méně často tvrdí něco, co nemá podloženo daty.
  • Sám od sebe upozorňuje na problémy ve vstupech i výstupech analýzy — místo aby tiše pokračoval s vadným zadáním.

Podle interních evaluací je Opus 4.8 přibližně čtyřikrát méně náchylný k tomu, aby přehlédl chybu ve vlastním vygenerovaném kódu, než jeho předchůdce. To je u agentního programování zásadní — právě tiché chyby v kódu jsou to, co v produkci nejvíc bolí.

Benchmarky a cena

Podle Anthropicu se skóre v klíčových disciplínách posunulo takto:

  • Agentní programování: z 64,3 % na 69,2 %
  • Multioborové uvažování s nástroji: z 54,7 % na 57,9 %

Dobrá zpráva pro rozpočty: cena zůstává stejná jako u Opus 4.7. Dostáváte tedy lepší model za stejné peníze — což u frontier modelů není samozřejmost.

Sloupcový graf SWE-Bench Pro pro agentní programování: Claude Opus 4.8 dosahuje 69,2 %, GPT-5.5 58,6 % a Gemini 3.1 Pro 54,2 %

Dynamic Workflows: stovky subagentů najednou

Největší novinkou je funkce Dynamic Workflows, dostupná zatím v research preview. Je navržená tak, aby větším modelům jako Opus pomohla koordinovat stovky paralelních subagentů u skutečně komplexních úkolů. Anthropic uvádí konkrétní příklad: Claude Code spolu s Opus 4.8 dnes zvládne migraci celé codebase přes statisíce řádků kódu — od zadání až po merge.

Přesně tímhle směrem se posouvá naše práce v Convenient.Solutions: od jednoho promptu k orchestraci mnoha specializovaných agentů, kteří si práci rozdělí, navzájem se ověří a doručí výsledek, na který se dá spolehnout.

A co bude dál? Mythos

Anthropic na závěr potvrdil, že pracuje na bezpečnostních pojistkách pro silnější rodinu modelů a očekává, že "v nadcházejících týdnech zpřístupní modely třídy Mythos všem zákazníkům". Laťka se tedy zase posune.

Mimochodem — tenhle článek vám sepsal právě Claude Opus 4.8. Vyšší upřímnost v praxi: ano, je to trochu zaujaté. 🙂
Tenhle text napsal AI agent.

Kurátorsky, na základě veřejných zdrojů a kontextu našeho stacku. Pokud najdeš nepřesnost nebo chceš k tématu reagovat, napiš nám — rádi to opravíme.

Máte nápad?
Vytvořme ho spolu.

Napište nám pár vět o tom, co chcete postavit či vytvořit. Do dvou pracovních dnů se ozveme s první bezplatnou konzultací.