Как Anthropic стала настолько хороша в программировании

Год назад стартап запустил ИИ-модель, которая поразила мир программирования. Все остальные в Кремниевой долине до сих пор пытаются догнать.

Генеральный директор Anthropic Дарио Амодеи Источник: Anthropic

Автор:Алистер Барр, глобальный технический редактор Business Insider. Дата публикации: 22 июля 2025 года

Anthropic стала доминирующим поставщиком ИИ-интеллекта для программирования, и успех стартапа вызвал волну самоанализа, теоретизирования и лихорадочных попыток «кода красного уровня» по всей Кремниевой долине.

Цель всей этой бешеной деятельности — выяснить, как Anthropic стала настолько хороша в программировании.

«Это вопрос на триллион долларов», — сказал Куинн Слэк, генеральный директор стартапа Sourcegraph, который полагается на модели Anthropic. «Это как вопрос, почему Кока-кола лучше Пепси?»

Илон Маск хочет знать ответ. Его стартап xAI пытается свергнуть Anthropic в последнее время. Бешеная гонка Марка Цукерберга за ИИ-талантами и инфраструктурой частично обусловлена тем же стремлением понять лидерство Anthropic в программировании и догнать его.

Здесь много поставлено на карту. С момента прорыва Anthropic в области ИИ-программирования чуть более года назад доходы резко выросли. Сейчас компания получает миллиарды долларов, в основном от других компаний, платящих за доступ к её моделям для задач программирования. Стартап вскоре может стоить 100 миллиардов долларов.

Поражён моделью

Слэк из Sourcegraph помнит точный момент, когда он понял, что у Anthropic в руках крупный прорыв.

Это было в июне 2024 года, когда Anthropic выпустила свою модель Claude Sonnet 3.5. Слэк был поражён.

«Мы сразу сказали: 'эта модель лучше всего остального в плане способности писать код большого объёма' — высококачественный код, которым гордился бы человек», — сказал он.

Слэк быстро организовал встречу в Sourcegraph и объявил, что Sonnet 3.5 станет их стандартной ИИ-моделью, обеспечивающей базовый интеллект, который питает сервис программирования стартапа для разработчиков. И он предоставил её бесплатно.

Некоторые коллеги хотели больше времени для оценки того, имеет ли смысл такой кардинальный шаг с финансовой точки зрения. Но Слэк настаивал.

«Anthropic изменила всё», — сказал он. «И как стартап, если ты не движешься с такой скоростью, ты умрёшь.»

Платформа для «вайб-кодинга»

Чуть более года спустя модели Anthropic питают большинство топовых сервисов ИИ-программирования, включая Cursor, Augment и GitHub Copilot от Microsoft.

Даже Meta использует модели Anthropic для поддержки своего внутреннего помощника по программированию Devmate. ИИ-стартап для программирования Windsurf собирался быть приобретённым OpenAI, но Anthropic отключила доступ к своим моделям Claude, и сделка рухнула. Теперь Windsurf снова использует Anthropic.

Все эти видео в социальных сетях подростков, занимающихся «вайб-кодингом» новых приложений и веб-сайтов? Невозможно без прорыва Anthropic в ИИ в июне 2024 года.

Что ещё более удивительно, так это то, что лидерство Anthropic в ИИ-программировании сохраняется. Её последние модели, включая Claude Sonnet 4, по-прежнему лучшие в программировании спустя более года. Это почти неслыханно в ИИ, когда новые достижения кажется появляются каждый день.

Попытка ответить на вопрос на триллион долларов

Кремниевая долина не отказалась от попыток раскрыть секреты ИИ-программирования Anthropic.

Несколько лет назад Anthropic опубликовала бы длинную исследовательскую работу, подробно описывающую данные, техники и архитектуру, которые она использовала, чтобы сделать Sonnet 3.5 экспертом по программированию. Однако сейчас конкуренция настолько жестокая, что все ИИ-лаборатории держат свой ИИ-соус в строжайшем секрете.

Тем не менее, в недавнем интервью Business Insider исполнительный директор Anthropic Диана Пенн поделилась некоторыми подсказками о том, как стартап совершил этот прорыв. Соучредитель Бен Манн также недавно обсудил некоторые успешные техники в подкасте.

BI также взял интервью у нескольких генеральных директоров и основателей ИИ-стартапов для программирования, которые полагаются на ИИ-модели Anthropic, а также у эксперта по программированию из MIT.

Начнём с Эрика Симонса, энергичного генерального директора Stackblitz, стартапа, стоящего за блокбастерным сервисом «вайб-кодинга» Bolt.new.

Генеральный директор StackBlitz Эрик Симонс выступает на хакатоне стартапа в Сан-Франциско

Симонс думает, что Anthropic заставила свои существующие модели писать код и развёртывать его. Затем компания оценила весь развёрнутый код через сочетание человеческой экспертизы и автоматизированного ИИ-анализа.

С программным кодом относительно легко оценить хорошие и плохие результаты. Это потому, что код либо работает, либо нет, когда развёрнут. Это создаёт чёткие сигналы ДА и НЕТ, которые действительно ценны для обучения и тонкой настройки новых ИИ-моделей, объяснил он.

Anthropic взяла эти сигналы и направила их в данные для обучения и процесс разработки новых моделей Sonnet AI. Эта стратегия обучения с подкреплением произвела ИИ-модели, которые были намного лучше в программировании, согласно Симонсу, который был одинаково поражён способностями Sonnet 3.5 летом 2024 года.

Оценки человеком против ИИ

Соучредитель Anthropic Бен Манн недавно появился в подкасте и, казалось, наслаждался идеей того, что остальная часть Кремниевой долины всё ещё не догнала способности его стартапа в ИИ-программировании.

«У других компаний были, типа, коды красного уровня для попыток догнать в способностях программирования довольно долго, и они не смогли этого сделать», — сказал он. «Честно говоря, я как-то удивлён, что они не смогли догнать, но я это приму.»

Тем не менее, когда его подтолкнули к ответам, он объяснил некоторые ключи к успеху Anthropic здесь.

Манн построил систему данных обратной связи от человека в Anthropic в 2021 году. Тогда было относительно легко для людей оценивать сигналы, такие как был ли результат модели A лучше чем B, и передавать это обратно в процесс разработки ИИ через популярную технику, известную как Обучение с подкреплением от человеческой обратной связи, или RLHF.

«По мере того как мы больше обучали модели и значительно масштабировались, стало сложнее найти людей с достаточной экспертизой для значимого вклада в эти сравнения обратной связи», — объяснил Манн в подкасте No Priors. «Для программирования кто-то, кто ещё не является экспертным инженером-программистом, вероятно, имел бы много проблем с оценкой того, была ли одна вещь лучше другой.»

Поэтому Anthropic стала пионером нового подхода, называемого Обучение с подкреплением от ИИ-обратной связи, или RLAIF. Вместо людей, оценивающих результаты ИИ-модели, другие модели выполняли бы анализ.

Чтобы эта более автоматизированная техника работала, Anthropic написала серию принципов на английском языке для своих моделей, которым нужно следовать. Стартап назвал это Конституционным ИИ.

«Процесс очень простой», — сказал Манн. «Вы просто берёте случайный запрос типа 'Как мне думать о моих налогах?' и затем заставляете модель написать ответ. Затем вы заставляете модель критиковать свой собственный ответ в отношении одного из принципов, и если он не соответствовал принципу, то вы заставляете модель исправить свой ответ.»

Для программирования вы можете дать ИИ-моделям принципы вроде «Действительно ли это послужило окончательному ответу?» или «Сделала ли она кучу вещей, о которых человек не просил?» или «Выглядит ли этот код поддерживаемым?» или «Полезны и интересны ли комментарии?» объяснил Манн.

Эмпирический метод доктора Манна

Элад Гил, топовый ИИ-инвестор и ведущий No Priors, согласился, сказав, что чёткие сигналы от развёртывания кода и проверки его работы делают этот процесс плодотворным.

«С программированием у вас фактически есть прямой результат, который вы можете измерить: вы можете запустить код, вы можете протестировать код», — сказал он. «Есть как бы встроенная функция полезности, против которой вы можете оптимизировать.»

Манн привёл пример от своего отца, который был врачом. Однажды пациент пришёл с кожным заболеванием на лице, и доктор Манн не мог найти, в чём проблема. Поэтому он разделил лицо пациента на секции и применил разные лечения. Одна область очистилась, эмпирически выявив ответ.

«Иногда вы просто не знаете, и вам нужно пробовать вещи — а с кодом это легко, потому что мы можем просто делать это в цикле», — сказал Манн из Anthropic.

Конституционный ИИ и дальше

В интервью BI Пенн из Anthropic описала другие ингредиенты, которые вошли в то, чтобы сделать модели стартапа настолько хорошими в программировании.

Она сказала, что описание от Симонса, генерального директора StackBlitz, было «в целом верным», отметив при этом, что прорыв Anthropic в программировании был результатом многолетних усилий, включающих многих исследователей и множество идей и техник.

«Мы фундаментально сделали её хорошей в написании кода, или способной выяснить, как выглядит хороший код, через то, что вы можете считать испытаниями и итерациями», — сказала она. «Вы даёте модели разные вопросы и позволяете ей выяснить, каков правильный ответ на проблему программирования.»

Когда её спросили о роли Конституционного ИИ, Пенн сказала, что не может поделиться слишком многими деталями о точных техниках, но сказала, что «это определённо в моделях».

Использование инструментов без рук

Anthropic также обучила Sonnet 3.5 быть намного лучше в использовании инструментов, ключевой фокус, который начал превращать ИИ-модели из чат-ботов в более универсальных агентов — то, что стартап называет «виртуальными коллаборантами».

«У них нет рук», — сказала Пенн, поэтому вместо этого модели Anthropic были обучены писать код сами для доступа к цифровым инструментам.

Например, она сказала, что если модель Anthropic спрашивают о информации о погоде или ценах на акции, она может написать программное обеспечение для подключения к интерфейсу программирования приложений, или API, обычному способу для приложений получить доступ к данным.

Следование инструкциям

Когда проекты программного обеспечения становятся действительно большими, вы не можете выполнить работу за несколько минут. Более сложные задачи занимают дни, недели или дольше.

ИИ-модели были неспособны придерживаться долгосрочных работ, подобных этим. Но Anthropic активно инвестировала в то, чтобы сделать Sonnet 3.5 и более поздние модели намного лучше в следовании человеческим инструкциям.

Таким образом, если модель застрянет на длинной проблеме программирования, она может принять руководство от разработчиков, чтобы продолжить — по сути, лучше слушая, чтобы понять намерение своих человеческих коллег, объяснила Пенн. (Эй, мы все можем стать лучше в этом).

Знание того, что запоминать

Даже лучшие человеческие разработчики программного обеспечения не могут держать всё, связанное с проектом программирования, в своих мозгах. Репозитории GitHub, содержащие код, изображения, документацию и истории ревизий, могут быть массивными.

Поэтому Anthropic обучила свои ИИ-модели создавать что-то вроде черновика, где она записывает заметки во внешней файловой системе, исследуя такие вещи, как база кода.

«Мы обучаем её использовать этот инструмент очень хорошо», — сказала Пенн (пока я лихорадочно нацарапывала заметки на своём собственном блокноте для репортажей).

Ключ здесь в том, что модели Anthropic были обучены запоминать больше выдающихся деталей проектов программирования и игнорировать менее важные вещи.

«Не полезно говорить: 'Диана носит цветную рубашку в этом разговоре, а Алистер носит зелёную рубашку'», — сказала Пенн, описывая интервью BI, происходящее в тот момент. «Важнее отметить, что мы говорили о программировании и о том, как Anthropic сосредоточилась на качестве программирования.»

Это лучшее использование памяти означает, что модели Anthropic могут предлагать множественные изменения кода в ходе всего проекта, что-то, в чём другие ИИ-модели не так хороши.

Claude Code и данные терминала

Какое-то время, примерно в 2022 году, казалось, что прогресс ИИ происходит автоматически, через больше данных, больше GPU и большие тренировочные прогоны.

«Реальность в том, что есть очень дискретные прорывы, и очень дискретные идеи, которые приводят к этим прорывам», — сказал Армандо Солар-Лезама, заслуженный профессор вычислительной техники в MIT. «Нужны исследователи и инвестиции в исследования, чтобы произвести следующую идею, которая приведёт к следующему прорыву.»

Вот как произошло завоёванное тяжким трудом лидерство Anthropic в программировании. Но доступ к детальным, гранулярным данным о том, как человеческие разработчики пишут программное обеспечение, критически важен для того, чтобы оставаться впереди в этой части ИИ-гонки, добавил он.

У Эндрю Филева есть связанная с этим теория. Он генеральный директор Zencoder, ещё одного сервиса ИИ-программирования, который использует модели Anthropic.

Филев думает, что данные из использования компьютерного терминала являются ключом к обучению ИИ-моделей быть хорошими в программировании. Терминал — это текстовый интерфейс, который позволяет разработчикам отправлять инструкции в операционную систему компьютера или программное обеспечение. Они вводят информацию через «командную строку» и, надеюсь, получают результаты.

«Большие языковые модели отлично работают с текстом», — сказал он мне в недавнем интервью об Anthropic. «Компьютерный терминал, где вы ведёте команды, в основном тоже текст. Поэтому в какой-то момент люди поняли, что они должны просто дать эти данные своей ИИ-модели, и она может делать удивительные вещи — вещи, которые ранее никогда не работали.»

В конце мая Anthropic выпустила Claude Code, инструмент командной строки для ИИ-программирования, который работает с существующими терминалами разработчиков.

Внезапно Anthropic теперь конкурирует против своих основных клиентов — всех тех других сервисов ИИ-программирования.

Этот шаг также создал прямые отношения между Anthropic и разработчиками, давая ИИ-лаборатории доступ к более богатому источнику данных о том, как экспертные люди пишут программное обеспечение.

«Количество и скорость, с которой мы учимся, намного меньше, если у нас нет прямых отношений с нашими пользователями программирования», — сказал Манн из Anthropic. «Поэтому запуск Claude Code был действительно важен для нас, чтобы получить лучшее понимание того, что нужно людям, как мы делаем модели лучше, и как мы продвигаем современное состояние?»

Теоретически эта гранулярная информация могла бы использоваться для помощи в обучении и тонкой настройке следующих моделей Anthropic, потенциально давая стартапу преимущество в данных, которое могло бы сохранить его лидерство в ИИ-программировании ещё дольше.

«Мог бы я делать это без последних моделей Anthropic? Нет», — сказал Слэк из Sourcegraph. «И были бы их модели настолько хороши без Claude Code? Я так не думаю.»

Источник: Business Insider Переведено с английского языка

Оригинальная статья: "The Trillion-Dollar Question: How Did Anthropic Get so Good at Coding?" by Alistair Barr

1 comments

А точно ли это заслуга моделей, а не просто хороший маркетинг и эффект вау-первого раза

routes.post.similarPosts