Если ты строишь большие проекты на Spec-Driven разработке, выдаёшь 10–20k LOC/день прод-готового, грамотно спроектированного кода (не вайбкодинг), и веришь, что открытые модели с продвинутым harness'ом обыгрывают фронтир — читай дальше.
Мы строим Business Operating System — платформу, где AI-агенты создают и ведут бизнесы для предпринимателей.
Цель
Сделать работу AI-агентов автономной, целенаправленной и проактивной: Agentic Scaffolding поверх открытых моделей превращает цель в план, действия, evidence, feedback loop и escalation/rollback — чтобы агент не ждал промпта, а двигал задачу до результата.
Что делаешь
• Проектируешь Agentic Scaffolding: goal graph, task queue, memory, tool grants, budgets, eval gates, event triggers и escalation policy — чтобы агент сам понимал следующий шаг, когда действовать и когда звать человека.
• Организуешь Spec-Driven разработку и делаешь её прозрачной для команды.
• Собираешь модуль Harness: память, скиллы, тулы, оркестратор, модели.
• Гоняешь evals harness-модулей: модификация → бенчмарк → … → прод.
• Развиваешь инфраструктуру под оркестрацию.
Требования
• Spec-Driven Dev, >3 мес. в проде. Минимум один из: OpenSpec, GStack, GitHub Spec Kit, Kiro. Объясняешь, почему OpenSpec выигрывает на brownfield, а Spec Kit — на greenfield.
• Memory & mind-maps для агентов. Строил memory layer на чём-то из: gbrain, graphify, mem0, Letta, Zep + Graphiti. Знаешь разницу между flat-vector и temporal knowledge graph.
• Параллельная оркестрация, >5 агентов одновременно. Гонял один из: Opencode, Cline, Claude Squad, Conductor, Claude Code Agent Teams. Понимаешь worktree isolation, shared task list, single-writer locks.
• Persistence. Живёшь в tmux (или zellij). Раны переживают SSH-таймауты и ребуты.
Отбор: оффер за 1 встречу
Покажи на демо-интервью, как ты управляешь агентами: как делаешь спеки понятными себе самому, как не теряешься в планах, как исполняешь. Фидбек сразу.
Harnesses. Использовал минимум 2 из: OpenHands, OpenCode, OMA. Можешь сравнить agent loop, tool-API и orchestration model — и объяснить, почему это важно для evals.
Стек на surface: TypeScript / React / Postgres. Но стек — не главное.
Профиль. Технический вуз, вероятно финалист олимпиад. Стартап-психотип, исследовательский метод. Full commit — без параллельных пет-проектов.
Ключевые навыки
- TypeScript
- React
- PostgreSQL