Podzielę się tym, jak używam siedmiu modeli do zbudowania środowiska pracy Harness engineering. Duże okno dzieli się na dwie części, po lewej stronie Codex i po prawej Zellij, które jednoczy sesję.
Codex jest wszystkim znany, Zellij to wbudowany moduł terminalowy z zarządzaniem wieloma terminalami, który pozwala na otwieranie wielu niezależnych terminali do zarządzania pamięcią. Przy następnym uruchomieniu wystarczy wpisać określone polecenie sesji, aby przywrócić wszystkie otwarte terminale i układ, automatycznie przywracając kontekst (to taki zamiennik tmux, a nauka tmux to prawdziwa męka. Zellij ma tę przewagę, że można myszką trafiać w różne terminale, a zaznaczony tekst automatycznie kopiować do schowka)
W kwestii modeli wykorzystałem 7 modeli: Gpt5.5, Grok4.3, Gemini 3.1, Glm5.1, Composer2.5, Kimi (mam subskrypcję Claude za dwadzieścia dolców, czysta oszukańcza sprawa, wcale nie jest trwała, tylko w kluczowych momentach wymieniam myśli z Gpt)
Podział pracy wygląda następująco:
1️⃣ Ramy i kontrola produktów:
Gpt5.5: jest głównym projektantem, odpowiedzialnym za ramy, przydzielanie zadań, przegląd końcowy i podejmowanie decyzji.
Grok4.3: odpowiada za przegląd pierwszej wersji, zgłasza problemy deweloperów, przygotowuje ostateczny przegląd dla gpt
2️⃣ Deweloperzy: Gemini, Glm5.1, Composer2.5, Kimi2.6. Na podstawie dokumentacji przepływu zadań z Gpt, synchronizują i równolegle prowadzą prace rozwojowe.
Po każdej rundzie rozwoju, Grok przeprowadza pierwszy wspólny przegląd i przekazuje uwagi do Gpt do przeglądu końcowego. Jeśli wystąpi błąd, Gpt wydaje konkretne polecenia dla modeli do poprawki. Jeśli akceptacja przebiegnie pomyślnie, przechodzi do następnej rundy układania i przydzielania zadań 🔄
Te procesy, przywracanie kontekstu i integracja oraz normy dotyczące rozwoju, lokalizacji modeli itp. zostały wszystkie spisane w dokumentacji Agenta jako środowisko Harness engineering. W środku zintegrowano normy rozwoju z andrej-karpathy-skills/CLAUDE.md
Claude Code ma ultrakodowy automatyczny tryb dynamicznych przepływów pracy. Claude sam ocenia złożoność zadań, automatycznie organizuje równoległe podagentów, realizując procesy „rozumieć → zmieniać → weryfikować” i inne wieloetapowe procesy, bez potrzeby ręcznego uruchamiania przez użytkownika.
W przyszłości można spróbować bezpośrednio zlecić cc przejęcie całego procesu jako mózgu kontrolnego do prowadzenia różnych rund rozwoju. Dopóki granice norm Harness są jasno określone, a osobiste wymagania i projekt są wcześniej przedstawione w trybie Plan, uruchomienie tego to jak rzeźnia tokenów 🐷
#BTC #vibecoding