Blisko 9 na 10 pilotaży agentów AI nie trafia do produkcji — i wbrew obiegowej opowieści nie dlatego, że firmy wybrały „słaby" model. Brakuje czegoś, co w 2026 roku zyskało własną nazwę: harness. Harness to warstwa, którą buduje się wokół modelu — reguły, narzędzia, granice uprawnień, mechanizmy sprawdzania i monitoring — i to ona, a nie sam model, coraz częściej decyduje o tym, czy AI przynosi pieniądze. W tym tekście wyjaśniam, czym jest harness, skąd się wziął i dlaczego warto rozumieć to pojęcie, niezależnie od wielkości firmy.
To zresztą ta sama bariera, którą opisywałem wcześniej: „udany" pilot AI nie wchodzi do produkcji, bo zabrakło wszystkiego, co dzieje się wokół modelu — właściciela, procesu, kontroli. Harness to nazwa dla tej właśnie warstwy.
Dlaczego rynek patrzył tylko na model
Przez ostatnie dwa lata rynek żył pytaniem, który model jest najlepszy. To zrozumiałe — modele robiły wrażenie i łatwo było uwierzyć, że wystarczy wybrać ten właściwy, a reszta sama się ułoży. Tymczasem dojrzewanie tej technologii poszło w innym kierunku, niż sugerowały nagłówki.
Dobrze pokazuje to jeden eksperyment. Zespół LangChain poprawił skuteczność swojego agenta programistycznego o blisko 14 punktów procentowych, nie zmieniając modelu ani razu. Zmienił tylko to, co go otacza: pętle samosprawdzania, sposób podawania informacji i mechanizmy wychwytujące błędy. Innymi słowy — ten sam silnik, inna obudowa, zupełnie inny wynik.
Skąd wziął się harness i po co nowa nazwa
Termin spopularyzował na początku 2026 roku Mitchell Hashimoto — współtwórca Terraform, człowiek z korzeniami w infrastrukturze, nie w marketingu AI. Opisał prostą zasadę: kiedy agent popełni błąd, nie poprawiaj pojedynczego przypadku, tylko zbuduj wokół niego rozwiązanie, dzięki któremu nigdy więcej tego błędu nie popełni. Samo słowo harness znaczy dosłownie „uprząż" albo „rusztowanie" — zostawiam je w oryginale, bo tak mówi się o tym w praktyce. Stąd formuła, która zrobiła się głośna: Agent = Model + Harness.
Uczciwie trzeba dodać, że część praktyków kręci nosem. Bo testy, monitoring czy kontrola uprawnień istniały w inżynierii oprogramowania na długo przed tym terminem. Mają rację co do treści. Ale nazwa ma swoją wartość — daje zarządom wspólne słowo na pracę, która do tej pory ginęła gdzieś między „IT" a „innowacjami", i którą teraz można świadomie zaplanować i sfinansować.
W praktyce harness to kilka warstw: zbiór reguł, które agent czyta na starcie, dostęp do narzędzi, granice uprawnień, pętle weryfikacji oraz monitoring. Claude Code, Cursor, GitHub Copilot czy Codex to dziś właśnie gotowe harnessy wokół modeli — całe środowisko pracy z agentami, nie „czat z modelem".
Dwa harnessy — i tylko jeden jest Twoją przewagą
Tu pojawia się rozróżnienie, które dla decydenta jest najważniejsze. Część harnessów budują dostawcy modeli — wbudowane bezpieczeństwo, obsługę narzędzi, zarządzanie kontekstem. To warstwa, która szybko staje się standardem i którą dostajesz w cenie narzędzia. Nie ma sensu jej odtwarzać.
Drugą warstwę budujesz Ty — pod swój konkretny proces. To Twoje reguły, Twoje dane, Twoje zabezpieczenia, Twoja definicja tego, co znaczy „dobrze zrobione". I to właśnie ta warstwa jest realną przewagą, bo zapisuje wiedzę Twojej organizacji i z każdą poprawką staje się trudniejsza do skopiowania. Model możesz wymienić jak silnik — i właśnie dlatego wybór dostawcy AI to nie wybór modelu, lecz całej rodziny usług. Tej warstwy nie wymienisz.
Stąd prosty wniosek: ten pierwszy harness warto oddać dostawcy. Drugiego nie oddawaj jednorazowemu projektowi konsultingowemu, bo to w nim zostaje instytucjonalna pamięć firmy.
Co naprawdę działa
Badania pokazują tę samą prawidłowość z różnych stron. Kod tworzony przez agenta bez nadzoru wypadał słabo na skali utrzymywalności — niezależnie od użytego modelu. Ten sam kod z nadzorem człowieka i z warstwą kontroli wypadał kilkukrotnie lepiej. Różnicę robił nie model, lecz to, co go otaczało: granice, testy, kontrola zakresu. To nie magia technologii, tylko efekt dojrzałego procesu.
Mój wniosek dla Zarządów i Właścicieli
Niezależnie od wielkości firmy zasada jest ta sama. Przestań rozstrzygać, na którym modelu się wystandaryzować — postaw na przenośną warstwę reguł i traktuj model jak wymienny silnik. Cała różnica leży w tym, co zbudujesz wokół niego, i właśnie w tę warstwę warto zainwestować najpierw, bo to ona wychwytuje błędy, gdy model się myli.
Skala zmienia tylko ciężar tej pracy, nie jej kierunek. W dużej organizacji własny harness to wieloletnie aktywo, a nie jednorazowy projekt konsultingowy — i potrzebuje osoby, która za niego odpowiada; w firmach, które robią to poważnie, taka rola stała się normą. W małej firmie ten sam harness mieści się w jednym pliku z regułami opisującym Twój proces, jednej liście tego, czego agentowi robić nie wolno, jednym mechanizmie sprawdzającym efekt i prostym zapisie tego, co się działo. To godziny pracy, nie wielkie wdrożenie. Stąd dla mniejszej firmy płynie prosty wniosek: nie kupuj „agentowej transformacji" od dostawcy, który obiecuje wszystko — skorzystaj z gotowego harnessu, który dają narzędzia takie jak Claude Code, Cursor czy Copilot, i dołóż własną, cienką warstwę pod jeden konkretny proces. Najlepiej taki, w którym łatwo sprawdzić, czy wynik jest dobry, a więc zwykle marketing, sprzedaż albo obsługa klienta.
Jest jeszcze jeden powód, by zacząć teraz, i dotyczy obu grup. Od sierpnia 2026 zaczynają obowiązywać unijne wymogi dla systemów AI wysokiego ryzyka — między innymi w rekrutacji, scoringu czy monitoringu pracowników. Termin bywa przesuwany w dyskusjach regulacyjnych, ale planowanie pod wcześniejszą datę jest po prostu bezpieczniejsze. Warstwa weryfikacji, logowania i nadzoru człowieka to przy okazji infrastruktura zgodności z AI Act, nie tylko innowacji. A o jedno zapyta każdy regulator niezależnie od wielkości firmy: o krótką politykę korzystania z AI dla zespołu.
Nie pytaj: „Który model AI wybrać?". Zapytaj raczej: „Co zbudujemy wokół modelu, żeby na niego można było polegać?". Bo zanim model zacznie przynosić pieniądze, ktoś musi zbudować wokół niego warstwę, która go pilnuje.
Droga Czytelniczko/Drogi Czytelniku. Jeśli uważasz, że opisany powyżej temat dotyczy Twojej firmy i chcesz porozmawiać ze mną w gronie Zarządu o tym, jak zbudować taką warstwę wokół AI w realiach Twojej organizacji, zapraszam do kontaktu. Punktem startu zwykle jest strategia AI dla firm. Leszek Giza.
