Kimi K2.6: открытая модель Moonshot AI сравнялась с GPT-5.5 в программировании
Moonshot AI выпустила Kimi K2.6 — open-weight модель с 1 трлн параметров, которая сравнялась с GPT-5.5 на SWE-Bench Pro и стоит на 88% дешевле. Разбираем архитектуру, бенчмарки и Agent Swarm.
20 апреля 2026 года пекинский стартап Moonshot AI представил Kimi K2.6 — новую open-weight модель, которая вплотную приблизилась к флагманам закрытого рынка. Модель с 1 триллионом параметров не уступает GPT-5.5 в задачах программирования, а её стоимость в 8 раз ниже, чем у Claude Opus 4.7. Рассказываем, что умеет Kimi K2.6 и почему это важно для рынка ИИ.
Техническая начинка
Kimi K2.6 построена на архитектуре Mixture-of-Experts (MoE): 384 эксперта общим объёмом 1 трлн параметров, из которых 32 млрд активны на каждый токен. Контекстное окно — 262 144 токена. Модель обрабатывает текст, изображения и видео (mp4, mov, avi, webm), а для локального запуска поддерживает нативную INT4-квантовку.
Moonshot выпускает модель в четырёх вариантах: Instant для быстрых ответов, Thinking с цепочками рассуждений для сложных задач, Agent для автономной работы с инструментами и Agent Swarm — способный одновременно управлять 300 суб-агентами.
Agent Swarm: 300 агентов в одной задаче
Главное нововведение K2.6 — масштабированный Agent Swarm. Если K2.5 управляла 100 агентами и 1 500 шагами, то новая версия координирует до 300 параллельных суб-агентов на 4 000 шагов. Агенты имеют постоянную память, наборы инструментов и распределяют задачи по профилям компетенций.
Moonshot продемонстрировала 13-часовой автономный прогон: модель самостоятельно переписала восьмилетний движок биржевого матчинга exchange-core — более 1 000 вызовов инструментов, 4 000+ строк кода, прирост пропускной способности на 185% (с 0,43 до 1,24 млн транзакций в секунду). Ещё один тест — портирование инференс-движка Qwen 3.5 на Zig с результатом 193 токена в секунду, что на 20% быстрее LM Studio.
Модель также поддерживает Claw Groups — фреймворк, где люди и агенты (любые модели, любые устройства) работают в общем пространстве, а K2.6 выступает координатором. Пока это research preview, но команда Moonshot уже использовала своего агента пять дней подряд для мониторинга и эксплуатации RL-инфраструктуры.
Бенчмарки: где K2.6 обходит конкурентов
На ключевом бенчмарке для разработчиков SWE-Bench Pro модель набирает 58,6% — столько же, сколько GPT-5.5, и опережает GPT-5.4 (57,7%) и Claude Opus 4.6 (53,4%). На Humanity's Last Exam с инструментами — 54,0%, первое место среди всех сравниваемых моделей. DeepSearchQA — 92,5% F1 при 78,6% у GPT-5.4, что говорит о серьёзном преимуществе в автономном веб-исследовании.
В чистом математическом рассуждении модель пока уступает: AIME 2026 — 96,4% против 99,2% у GPT-5.4, GPQA Diamond — 90,5% против 92,8%. Но для бизнес-задач, где важна цена за качество, K2.6 выглядит убедительно.
Доступность и стоимость
Moonshot API: $0,60 за миллион входных токенов и $2,50 за выходные. Для сравнения: Claude Opus 4.7 стоит $5,00 за входные — разница в 8,3 раза. OpenRouter предлагает модель по $0,60/$2,80.
Веса открыты под модифицированной лицензией MIT: свободное коммерческое использование, для продуктов с аудиторией более 100 млн MAU или выручкой выше $20 млн в месяц требуется видимая ссылка «Kimi K2.6». Модель доступна на Hugging Face, через Kimi Code (терминал и IDE), в Kimi App и на платформе Moonshot API с OpenAI-совместимым SDK.
Старые модели серии kimi-k2 будут отключены 25 мая 2026 года — Moonshot переводит пользователей на K2.6. Ближайшие месяцы покажут, сможет ли пекинский стартап закрепиться в роли главного конкурента закрытых гигантов, но уже сейчас это самая сильная open-weight модель для долгосрочных агентных задач.