Vyměňte GPT-5 za Claude v pracujícím agentovi a ve většině případů se toho téměř nic nezmění. Změňte způsob, jakým zpracovává opakované pokusy, co vkládáte do jeho kontextového okna nebo kdy se rozhodne zastavit, a celý agent se chová jinak. Tato mezera je signálem: model je nejmenší a nejsnadněji zaměnitelnou částí pracujícího agenta. Zajímavé inženýrství sídlí ve všem, co ho obklopuje.
Tento wrapper má nyní jméno. Odborníci se shodli na pojmu "harness" pro vrstvu, která z generátoru textu dělá něco, co v průběhu času provádí akce, místo aby spouštělo pevný skript. Pojem se začátkem roku 2026 rychle rozšířil na Twitteru a v technických blozích, což také znamená, že byl používán volně, přičemž totéž slovo v každém příspěvku dělalo trochu jinou práci. Tento článek to upřesňuje: co harness je, z čeho se skládá, jak se liší od "frameworku" a "scaffoldu" a proč je většina kvality vašeho agenta skryta v harnessu, nikoli v modelu.
Zkrácená verze
- Agent harness je software kolem LLM, který spravuje smyčku provádění, nástroje, paměť, kontext, stav, zpracování chyb a ochranné mechanismy. Model generuje text; harness rozhoduje, co model vidí, co může dělat, kdy zastavit a co se stane, když se něco pokazí.
- V produkci je volání modelu často nejmenší viditelnou částí povrchu systému. Slabší model v dobře postaveném harnessu může porazit silnější model v nekvalitním, zejména u dlouhodobých úloh náročných na nástroje.
- Harness má přibližně devět až jedenáct opakujících se komponent. Většina z nich jsou věci, které model nikdy přímo nedotýká.
- "Harness" není totéž jako "framework". Framework (LangGraph, agents SDK) je knihovna, se kterou stavíte; harness je běžící vrstva, kterou vám ta knihovna pomáhá sestavit.
Co je Agent Harness?
Agent harness je softwarová infrastruktura obklopující jazykový model, která spravuje smyčku provádění, přístup k nástrojům, paměť, kontext, persistenci stavu, zpracování chyb a ochranné mechanismy. Model generuje text. Harness rozhoduje, co model vidí v každém tahu, jaké akce může podniknout, kdy se zastaví a co se stane, když krok selže.
Nejjasnější vyjádření pochází od LangChain, kteří to redukují na rovnici: Agent = Model + Harness. Model poskytuje inteligenci. Harness je to, co tuto inteligenci umožňuje skutečně jednat ve světě.
"Harness je veškerý kód, konfigurace a logika provádění, která není samotným modelem."
— LangChain, Anatomie agent harness
Hranici nejlépe vnímám prostřednictvím jedné otázky: když váš agent udělá něco špatně, bylo vlastní uvažování modelu chybné, nebo mu systém kolem něj předal špatný kontext, špatné nástroje, nebo žádný způsob, jak se zotavit? Ve většině případů na reálném systému je to to druhé. Model správně uvažoval nad chybnými vstupy. Harness je to, co vstupy řídí.
Klíčový poznatek: Model generuje; harness řídí. Toto rozdělení je celý koncept.
Jaké jsou součásti agent harness?
Každý produkční harness sestavuje stejné opakující se části: smyčku provádění, která řídí model tah po tahu, přístup k nástrojům umožňující mu jednat, paměť mezi tahy, správu kontextu pro to, co právě vidí, perzistenci stavu, aby práce přežila napříč relacemi, zpracování chyb pro neúspěšné kroky a ochranné mechanismy omezující to, co může dělat. Produkční systémy přidávají ověřovací smyčky a orchestraci podagentů.
Užitečný přehled sestavený z toho, jak odborníci popisují reálné systémy:
- Smyčka provádění / řízení: co řídí agenta krok za krokem. Zavolat model, přečíst výstup, spustit požadovaný nástroj, vrátit výsledek, opakovat do podmínky zastavení.
- Přístup k nástrojům: funkce, API, spouštění kódu a souborový systém, ke kterým má model přístup.
- Paměť: co si agent uchovává napříč tahy a sezeními.
- Správa kontextu: co se balí do okna modelu v každém tahu a co se komprimuje, když přeteče.
- Perzistence stavu / checkpointing: ukládání stavu agenta, aby přerušený nebo pozastavený běh mohl pokračovat.
- Zpracování chyb: opakované pokusy, záložní řešení a obnova při selhání volání nástroje nebo modelu.
- Bezpečnostní mantinely: omezení toho, co agent může dělat, jako jsou povolené nástroje, limity kroků a validace výstupu.
- Ověřovací smyčky: agent (nebo harness) zkontroluje svou vlastní práci, než ji prohlásí za hotovou.
- Orchestrace subagentů: spouštění subagentů, delegování na ně a sběr výsledků při větších úkolech.
Ne všechny z nich jsou univerzální. Smyčka provádění, nástroje, zpracování kontextu a zpracování chyb se objevují i v prototypu vykouzeném přes víkend. Perzistence stavu, verifikace a orchestrace subagentů jsou tam, kde se prototypy a produkční systémy rozcházejí. Prototyp je může přeskočit; dlouhodobě běžící produkční agent ne. Popis Anthropic o dlouhodobě běžící agenti je prohlídkou částí určených pouze pro produkci: jak agent přebuduje své porozumění ze souboru průběhu po resetování kontextového okna a jak se testování zapojuje do smyčky.
Pro ty, kdo chtějí akademický most, nedávný přehled architektur agentů skládá tytéž součásti do menší formální n-tice základních komponent. Seznam praktika a rámec přehledu jsou dva úrovně přiblížení na stejnou strukturu: přehled komprimuje, výše uvedený soupis rozšiřuje. Číslo devět až jedenáct berte jako komponenty, které sdílí většina produkčních harnesses, nikoli jako ratifikovaný standard; obor ještě nic neratifikoval.
Klíčový poznatek: Většina pohyblivých částí agenta žije v harnessu, nikoli v modelu. Model je jednou z mnoha komponent.
Proč je harness důležitější než model?
Slabší model uvnitř dobře navrženého harness často překoná silnější model ve špatně navrženém. Důvod je mechanický, nikoli magický: end-to-end spolehlivost agenta je součinem spolehlivosti každého kroku, a většina těchto kroků (výběr nástrojů, sestavení kontextu, obnova po chybách) je úkolem harness, nikoli modelu. Vylepšete je a celý řetězec se stane spolehlivějším, bez ohledu na to, který model je uvnitř.
Aritmetika to dělá konkrétním. Předpokládejme, že každý krok v desetikrokové úloze uspěje 99% času. End-to-end úspěch není 99%. Je to 0,99 na desátou mocninu, asi 90%. Posuňte každý krok na 99,9% a end-to-end skočí na přibližně 99%. Spolehlivost na krok se násobí a spolehlivost na krok je převážně vlastností harness. Proto se optimalizace zpracování chyb a správy kontextu vyplatí více než výměna za model o půl bodu lepší na nějakém benchmarku.
Existují produkční signály ukazující stejným směrem. MongoDB, citující případovou studii Vercel, uvádí, že Vercel omezil většinu nástrojů svého agenta a sledoval, jak jeho míra úspěchu prudce vzrostla na stejném modelu s menším a čistším harness. Čtěte to jako konvergentní důkaz spíše než důkaz: je to jeden produkční případ, ne kontrolovaný experiment, ale ukazuje stejným směrem jako výše uvedená složená aritmetika a průzkumná práce.
Toto je heuristika, ke které se jako platformní inženýr stále vracím: kontext je úzkým hrdlem, nikoli surová schopnost modelu, a lešení postavené k zakrytí dnešních mezer modelu má tendenci být pohltit se spolu s tím, jak se modely zlepšují. Stavte trvalé části harness (smyčku, stav, obnovu) a nechte model pod ním zlepšovat se podle vlastního rozvrhu.
Klíčový poznatek: Když váš agent selže, podezřívejte harness dříve než model. Pravděpodobnost tomu nahrává.
Jaký je rozdíl mezi harness, scaffold a frameworkem?
Tyto tři se používají zaměnitelně, ale neměly by. A framework je knihovna nebo SDK, se kterým stavíte, například LangGraph nebo agents SDK. A harness je běžící vrstva provádění a správy okolo modelu, kterou vám framework pomáhá sestavit. A scaffold je nejvolnější ze tří: někdy téměř synonymum pro harness, někdy jeho prototypová verze, někdy konkrétně vrstva prompt a popisu nástrojů.
Slovní zásoba je skutečně neustálená a nejčistší věcí je zmapovat použití spíše než legislativně určit jedno. Slovník HuggingFace Slovník agentů říká to přímo:
"Mnoho z těchto termínů ještě nemá všeobecně přijímané definice a různé frameworky používají stejné slovo různě."
— HuggingFace, Slovník agentů
| Termín | Co označuje | Vztah |
|---|---|---|
| Framework | Knihovna nebo SDK, se kterou stavíte (LangGraph, SDK agentů) | Nástroj pro sestavení harness |
| Harness | Spuštěná vrstva kolem modelu: smyčka, nástroje, kontext, stav, guardrails | Co nasazujete a spouštíte |
| Scaffold | Volně používáno: téměř synonymum pro harness, nebo verze na úrovni prototypu / vrstvy promptů | Překrývá se s harness; méně přesné |
| Smyčka | Prováděcí cyklus uvnitř harness | Součást harness |
Praktický závěr pro uvažování o vlastním systému: když někdo řekne "framework", zeptejte se, zda myslí knihovnu nebo běžící věc. Když někdo řekne "scaffold", zeptejte se, zda myslí celý harness nebo jen vrstvu prompt-a-nástroje. Hodnota spočívá v disambiguaci, ne v nároku na poslední slovo.
Jak LangGraph implementuje vzor harness?
LangGraph je populární open-source Python implementace vzoru harness. Modeluje provádění agenta jako orientovaný graf uzlů a hran s typovaným stavem proudícím mezi nimi a každým přechodem, který lze uložit jako checkpoint. Pokud se abstraktní komponenty výše zdají neuchopitelné, LangGraph je místem, kde je lze vidět v konkrétní podobě v reálném nástroji.
Mapování je téměř jeden ku jednomu. Uzly a hrany tvoří prováděcí smyčku: každý uzel vykonává práci, každá hrana rozhoduje, kam jde řízení dál. Typovaný objekt stavu předávaný mezi uzly je komponenta context-and-state učiněná explicitní. Checkpointing (LangGraph uchovává stav prostřednictvím savers jako jeho implementace postavená na Postgres) je komponenta persistence stavu. Konfigurovatelný limit kroků je guardrail podmínky zastavení, který brání chybně se chovajícímu agentovi v nekonečném opakování. Stejné komponenty, pojmenované a propojené konkrétní knihovnou.
Pokud chcete spouštět LangGraph agenta na vlastním serveru nepřetržitě, jde o otázku nasazení, nikoli konceptuální. Viz náš Linux VPS průvodce pro tuto cestu. Zde je LangGraph jen propracovaným příkladem: důkaz, že "prováděcí smyčka", "persistence stavu" a "guardrail" nejsou abstrakce, ale věci, na které lze v reálném kódu ukázat.
Časté dotazy
Co je Agent Harness?
Agent harness je software kolem jazykového modelu, který ho mění v agenta. Spravuje prováděcí smyčku, přístup k nástrojům, paměť, kontext, persistenci stavu, zpracování chyb a guardraily. Model generuje text; harness rozhoduje, co model vidí, co může dělat, kdy zastavit a co se stane, když něco selže.
Je agent harness totéž co agent framework?
Ne. Framework je knihovna nebo SDK, se kterou stavíte, jako LangGraph nebo agents SDK. Harness je běžící vrstva pro vykonávání a řízení kolem modelu (smyčka, nástroje, kontext, stav a guardrails), kterou vám framework pomáhá sestavit. Framework používáte k sestavení harnessu.
Jaké komponenty má každý agent harness?
Většina harnessů sdílí opakující se jádro: prováděcí smyčku, přístup k nástrojům, paměť, správu kontextu, perzistenci stavu, zpracování chyb a guardrails. Produkční harnessy přidávají ověřovací smyčky a orchestraci subagentů. Prototypy mohou přeskočit části určené pouze pro produkci, ale smyčka, nástroje, zpracování kontextu a zpracování chyb se vyskytují téměř všude.
Co znamená „LLM je nejmenší částí vašeho agentního systému"?
Znamená to, že většina chování agenta a jeho spolehlivosti pochází z harnessu, nikoli z modelu. End-to-end spolehlivost je součinem míry úspěšnosti každého kroku a většina kroků je prací harnessu. MongoDB, citujíc případovou studii Vercel, hlásí skok v míře úspěšnosti způsobený pouze změnami harnessu, na stejném modelu. To je důkaz, že oprava harnessu překonává opravu modelu.
Kde žije kvalita vašeho agenta
Harness je místo, kde žije většina kvality agenta, a nyní máte slovník pro lokalizaci problémů ve vlastním systému. Můžete definovat harness, pojmenovat jeho komponenty, odlišit ho od frameworku a scaffoldu a uvažovat o tom, zda je daná chyba problémem modelu nebo harnessu.
Takže příště, když se váš agent chová špatně, nejprve proveďte audit vrstvy harnessu: kontext, který mu poskytujete, nástroje, které jste zpřístupnili, podmínky zastavení, které jste nastavili, způsob, jakým se zotavuje z neúspěšného kroku. Sáhněte po větším modelu až poté, co tato vrstva projde kontrolou. Ve většině případů to nebude nutné.