Гайд Anthropic назван лучшим руководством по ИИ-агентам

Аналитик Майлз Дойчер заявил, что в сеть попал внутренний гайд Anthropic по так называемой loop-инженерии — построению циклов работы ИИ-агентов. По его словам, это самое ценное руководство по ИИ, которое он прочитал за год, хотя факт утечки документа остается непроверенным утверждением.

Дойчер выделил пять ключевых принципов, вокруг которых, по его словам, строится каждый такой цикл. Он ссылается на публикацию инженера Энди Османа.

Хотите еще эксклюзивных новостей и аналитики? Подписывайтесь на наш телеграм-канал, обсуждайте новости и делитесь мнениями о последних событиях рынка в чате!

Как устроена loop-инженерия

Первый — обнаружение. Это процесс, когда агент сам находит себе задачи через сбои тестов, открытые задачи и коммиты. Второй — изоляция, при которой каждая задача получает отдельную рабочую ветку в системе контроля версий.

Третий принцип, который выделил Дойчер, — проверка: генератор кода никогда не должен сам оценивать свою работу. Четвертый — устойчивость, то есть запись состояния на диск, чтобы оно сохранялось между запусками. Пятый — расписание, при котором система работает по таймеру, в том числе пока пользователь спит.

Самым важным правилом Дойчер назвал разделение генератора и оценщика. По его словам, нужно использовать двух агентов: один пишет код, а второй выступает скептически настроенным судьей, который исходит из того, что код сломан. Оценщик при этом должен действовать — запускать тесты, нажимать кнопки, делать скриншоты, — и именно это, по словам Дойчера, реально отсекает плохой результат.

Дойчер перечислил и риски такого подхода. Среди них он назвал «долг по проверке», потерю понимания собственной кодовой базы, взрывной рост расходов на токены и «когнитивную капитуляцию» — когда человек перестает думать, полагаясь на то, что «цикл сам справится».

Для контроля над расходами аналитик предложил подход «штанги» по принципу 80 на 20. По его словам, для самых сложных задач, требующих максимального интеллекта, стоит использовать дорогие модели вроде Opus, а остальные 80% рутинной работы выполнять дешевыми моделями с открытым исходным кодом в рамках инструментария Claude Code. В пример для исполнения кода он привел модель GLM-5.2.

Личный файл настроек Карпатого

Схожую тему поднял инженер Хайраллах аль-Авади. По его словам, разработчик ИИ Андрей Карпатый присоединился к Anthropic пять недель назад, а знакомый из его команды показал файл Claude.md, который тот якобы использует в работе.

По словам аль-Авади, он внедрил этот файл в свою конфигурацию, и первый же ответ модели оказался совершенно другим. По его утверждению, Claude перестал давать обобщенные ответы и начал работать в той логике, в которой мыслит сам пользователь.

Обсуждения отражают реальный тренд: разработчики все активнее выстраивают автоматизированные циклы работы ИИ-агентов и ищут способы повысить их эффективность. Ключевыми темами остаются разделение ролей между моделями, контроль качества и удержание расходов на токены.