
Что такое Grok? От Grok 3 к Grok 5: путь xAI к AGI
Обзор Grok в 2026 году: эволюция, архитектурные прорывы, бенчмарки и ценовая экосистема.
В этом материале с точки зрения 2026 года рассмотрены эволюция Grok, ключевые технические решения, сравнения в бенчмарках и практические сценарии.
Содержание (Table of Contents)
- Введение: новое определение Grok в 2026 году
- Хронология эволюции: от Grok-3 до Grok-5 AGI
- Ключевые технологии: архитектурные прорывы Grok 4.1
- Сравнение лидеров: Grok 4.1 vs. GPT-5.2 vs. Gemini 3 Pro
- Практические сценарии: корпоративные агенты и Fun Mode
- Цены и экосистема: SuperGrok и API
- FAQ: вопросы о Grok 5 и AGI
- Источники (References)
1. Введение: новое определение Grok в 2026 году
Grok — флагманская передовая модель xAI на границе AGI. К началу 2026 года Grok — это уже не просто "дерзкий чат-бот", а система, которая объединяет данные реального мира в реальном времени, долгосрочные рассуждения (Long-horizon Reasoning) и нативное мультимодальное взаимодействие.
Ключевое преимущество Grok — опора на суперкомпьютер Colossus (более 300 000 GPU NVIDIA H200/Blackwell) и эксклюзивный доступ к живому потоку X (Twitter). Это дает Grok 4.1 более быстрые ответы в новостных всплесках, финансовой аналитике и прогнозировании настроений по сравнению с серией GPT-5 [^1][^2].
2. Хронология эволюции: от Grok-3 до Grok-5 AGI
Скорость итераций xAI в 2025 году удивила рынок. Ключевые вехи:
Grok-3: эпоха рассуждений (февраль 2025)
- Ключевое событие: введен "Thinking Mode" (chain-of-thought), впервые превосходящий GPT-4o в задачах по математике и программированию.
- Особенность: запущен DeepSearch, способный читать десятки свежих документов и собирать длинные аналитические отчеты [^3].
Grok-4: нативные инструменты и агенты (июль 2025)
- Архитектурное обновление: полностью переписанная нативная мультимодальная архитектура без внешнего визуального энкодера.
- Ключевая возможность: представлены Grok 4 Heavy и Grok 4 Fast. Впервые поддержаны нативные инструментальные вызовы: модель пишет Python и запускает его в песочнице для решения сложных задач [^2].
Grok-4.1 и 4.2: EQ и скорость (ноябрь–декабрь 2025)
- Grok 4.1: снизил уровень галлюцинаций на 65%, занял первое место в EQ-Bench и смягчил прежнюю "резкость" ответов [^1].
- Grok 4.20: шуточный релиз "4.20" от Маска, фактически тонкая настройка для финансов и креатива. Генерация изображений получила Flux Pro 2.0 и поддержку 4K-видео.
Grok-5: приближение сингулярности (январь 2026, ожидается)
- Текущий статус: финальное обучение на кластере Colossus 2.
- Слухи о масштабе: около 6 триллионов параметров. Маск говорит о "10% шансе" на узкий AGI с фокусом на понимании физического мира и нерешенных научных задач [^1].
3. Ключевые технологии: архитектурные прорывы Grok 4.1
Согласно последнему техническому документу xAI, успех Grok 4.1 опирается на три столпа:
-
Thinking Tokens (мыслительные токены): перед ответом Grok 4.1 генерирует невидимые "мыслительные токены" и через RL моделирует итеративное рассуждение за секунды. Это дает сильные результаты в LegalBench и FinanceBench [^4].
-
Real-time Firehose RAG (RAG на потоковых данных): в отличие от Gemini, зависящего от индексирования Google Search с задержкой, Grok напрямую подключен к firehose X.
- Преимущество: уже через 10 секунд после события Grok может собрать краткий дайджест из тысяч сообщений очевидцев.
-
Инфраструктура Colossus: дата-центр xAI в Мемфисе связывает десятки тысяч GPU через RDMA и достигает одной из лучших эффективностей обучения (MFU). Это позволяет xAI обновлять модели примерно вдвое быстрее OpenAI [^2].
4. Сравнение лидеров: Grok 4.1 vs. GPT-5.2 vs. Gemini 3 Pro
Срез бенчмарков на январь 2026 года (Artificial Analysis и LMSYS Arena):
| Показатель | xAI Grok 4.1 (Thinking) | OpenAI GPT-5.2 (High) | Google Gemini 3 Pro | Anthropic Claude 4.5 |
|---|---|---|---|---|
| Общее рассуждение (GPQA) | 82.4% | 81.9% | 79.5% | 80.1% |
| Актуальность | ⭐⭐⭐⭐⭐ (миллисекунды) | ⭐⭐⭐ (зависит от Bing) | ⭐⭐⭐⭐ (экосистема Google) | ⭐⭐ (только база знаний) |
| Кодинг (SWE-bench) | 68% (эксперт по Python) | 72% (уровень архитектора) | 65% | 70% |
| Окно контекста | 2,000,000 токенов | 500,000 токенов | 10,000,000 токенов | 1,000,000 токенов |
| Мультимодальность (видео/изобр.) | Очень сильная (FLUX 2.0 + видео) | Сильная (интеграция Sora 2.0) | Очень сильная (нативная обработка видео) | Сильная |
| Основной недостаток | Иногда слишком "персонализирован" | Дорого, строгая модерация | Иногда проседает логика | Ответы медленнее |
Краткий разбор:
- Grok 4.1 лидирует в реальном времени и нетривиальном мышлении, поэтому особенно интересен трейдерам и журналистам.
- GPT-5.2 остается чемпионом по кодингу и корпоративной продуктивности, с самой зрелой экосистемой (GPTs).
- Gemini 3 Pro выигрывает в анализе длинных контекстов благодаря окну 10M+ токенов [^4][^5].
5. Практические сценарии: корпоративные агенты и Fun Mode
Grok для госсектора и бизнеса
В конце 2025 года xAI запустила Grok Enterprise и получила сертификацию IL5 Министерства обороны США (DoD).
- Сценарий: Grok использовали для анализа глобальных геополитических настроений, переводя и интерпретируя неанглоязычные источники в реальном времени [^2].
Fun Mode и Grok Imagine
Фирменный "Fun Mode" в версии 4.1 обновился до "Roast Master".
- Режим генерирует острые сатирические комментарии и даже "поджаривает" пользователей по их публичным профилям.
- Grok Imagine: интегрированный движок FLUX позволяет генерировать и редактировать изображения (in-painting). Благодаря мягким правилам модерации он стал заметным инструментом для мемов в соцсетях.
6. Цены и экосистема: SuperGrok и API
- Личные пользователи:
- X Premium+ ($22/мес.): безлимитный Grok 4.1 Fast.
- SuperGrok ($40/мес.): доступ к Grok 4.1 Thinking и Grok 5 Preview, плюс генерация 4K-видео.
- API для разработчиков:
- xAI предлагает агрессивное ценообразование: вход
grok-4-fastстоит всего $0.20 / 1M токенов, что дешевле GPT-4o-mini, и нацелен на рынок агентов [^4].
- xAI предлагает агрессивное ценообразование: вход
7. FAQ: вопросы о Grok 5 и AGI
Q1: Когда выйдет Grok 5?
A: В конце 2025 года Маск намекал в прямых эфирах, что Grok 5 пройдет финальные проверки безопасности и выйдет в первом квартале 2026 года (вероятно, в марте). Текущий Grok 4.20 рассматривается как предрелиз.
Q2: В чем Grok 4.1 сильнее GPT-5.2?
A: Прежде всего в актуальности и готовности "говорить прямо". Если спросить, какие теории заговора сейчас обсуждают в X, Grok даст сводку с источниками, тогда как GPT-5.2 часто отвечает осторожнее. Контроль галлюцинаций в API (FActScore) у Grok также немного лучше [^4].
Q3: Достиг ли Grok уровня AGI?
A: Пока нет. Хотя Grok 5 позиционируют как "самый близкий к AGI", индустрия все еще спорит о самом определении. Grok показывает сверхчеловеческие результаты в отдельных областях (математика, физика), но для междисциплинарного планирования все еще нужен человек.
Q4: Как пользователям в Китае получить доступ к Grok?
A: Grok доступен только через X (Twitter) и API xAI. Из-за экспортных ограничений США и недоступности X в материковом Китае большинству пользователей доступ возможен лишь через легальные международные исследовательские каналы или корпоративные API.
8. Источники (References)
Данные и утверждения основаны на авторитетных публикациях и официальных документах за 2025-2026 годы:
- [^1] xAI Official Blog: "Grok 4.1 Release Notes: Reduced Hallucinations & EQ Leadership". (Nov 17, 2025). Available at: x.ai/blog
- [^2] TechCrunch: "Elon Musk's xAI raises $20B Series E, confirms Grok 5 roadmap". (Jan 6, 2026).
- [^3] CNET: "Grok 3 Launch: The Age of Reasoning Agents". (Feb 2025).
- [^4] Artificial Analysis: "LLM Leaderboard Jan 2026: Grok 4.1 vs GPT-5.2 vs Gemini 3". (Jan 2026). Available at: artificialanalysis.ai
- [^5] Android Authority: "Grok 3 vs Gemini 3 Pro: Why Google still wins on context length". (Dec 2025).
Автор

Рассылка
Присоединяйтесь к сообществу
Подпишитесь на рассылку, чтобы получать новости и обновления