Китай обучил ИИ-модель LongCat-2.0 без единого чипа Nvidia

Китайская компания Meituan выпустила LongCat-2.0 — большую языковую модель на 1,6 трлн параметров, обученную целиком на отечественном оборудовании. По заявлению компании, это первая в стране модель такого масштаба, прошедшая полный цикл обучения без западных чипов.

Пекинский гигант сервисов по доставке во вторник открыл исходный код LongCat-2.0. Модель располагает контекстным окном в 1 млн токенов, что ставит ее в один ряд с флагманом DeepSeek V4-pro, вышедшим в апреле. Ключевое отличие в том, что DeepSeek опирался на местные чипы только для инференса, тогда как Meituan задействовала отечественное оборудование и для предобучения.

Хотите еще эксклюзивных новостей и аналитики? Подписывайтесь на наш телеграм-канал, обсуждайте новости и делитесь мнениями о последних событиях рынка в чате!

Прорыв в обучении на отечественном железе

В Meituan заявили, что LongCat-2.0 стала первой в отрасли моделью на триллион параметров, прошедшей полный цикл обучения и инференса на кластере из 50 000 отечественных вычислительных карт. До сих пор местное оборудование считалось пригодным в основном для инференса — менее ресурсоемкого процесса, при котором уже обученная модель отвечает на запросы пользователей.

Предобучение устроено иначе. Это куда более вычислительно затратный этап, на котором модель обрабатывает огромные массивы данных и осваивает базовые закономерности. Долгое время китайское железо считалось недостаточно мощным для этой задачи, а большинство моделей на местных чипах оставались небольшими или ограничивались мультимодальными задачами.

По заявлению компании, LongCat-2.0 построена целиком на крупномасштабных кластерах из десятков тысяч ИИ-чипов типа ASIC. Такой чип создается под конкретные задачи в отличие от процессора общего назначения. Прямого поставщика оборудования Meituan не назвала, но сообщила, что использовала коммуникационную библиотеку Huawei (HCCL) для повышения стабильности обучения.

Прорыв привлек внимание отраслевых наблюдателей. По словам известного аналитика TP Huang, это снимает любые сомнения в способности суперкластеров Huawei Atlas-950 обучать крупные языковые модели. Аспирант Университета Лихай Ханьчи Сунь отметил, что околофлагманская производительность впервые достигнута на 50 000 отечественных ускорителей.

Где модель сильна и где пока отстает

В Meituan сообщили, что LongCat-2.0 показала сильные результаты в программировании и агентских задачах. По данным компании, модель обошла более раннюю Google Gemini 3.1 Pro в ряде тестов, включая Terminal-Bench 2.1 и SWE-Bench Pro.

Вместе с тем компания признала, что LongCat-2.0 пока уступает мировым флагманам — OpenAI GPT-5.5 и Anthropic Claude 4.8 Opus. Модель еще не проходила оценку на ведущих площадках вроде Artificial Analysis и Arena, а также на новейших тестах Agents’ Last Exam и CyberGym.

Несмотря на достигнутый рубеж, в Meituan отметили, что обойти западные графические процессоры по-прежнему непросто. По признанию представителей компании, сопутствующее программное сообщество вокруг отечественного железа развито слабее зрелой экосистемы Nvidia.

Предобучение на кластере более чем из 50 000 чипов создало серьезные системные сложности из-за масштаба модели и самого кластера. Главным проблемным местом в компании назвали память.

По данным Meituan, у отечественных ускорителей ее заметно меньше в пересчете на устройство, чем у чипа Nvidia H800, запрещенного к экспорту в Китай по правилам США. Чтобы обойти ограничения, компании пришлось приложить значительные усилия для создания стабильной и масштабируемой инфраструктуры.