Сбер представил открытые нейросети gigachat и kandinsky для бизнеса и разработчиков России

«Сбер» открыл доступ к новому поколению отечественных нейросетевых моделей, представив флагманские разработки в рамках линейки GigaChat: Ultra-Preview и Lightning. Эти модели созданы с нуля для решения задач на русском языке и распространяются по открытой лицензии MIT, что позволяет использовать их как в научных, так и в коммерческих целях. Такой шаг делает технологии доступными не только крупным корпорациям, но и небольшим компаниям и стартапам, способствуя развитию технологического суверенитета страны.

GigaChat Ultra-Preview — самая мощная и масштабная из выпущенных моделей. Несмотря на то, что её обучение всё ещё продолжается, уже сейчас она демонстрирует выдающиеся результаты. По данным независимых тестов на русском языке, модель обходит по качеству DeepSeek V3.1 и предшественника GigaChat Max 2, лидируя в бенчмарке MERA. Ultra-Preview способна обрабатывать большие объёмы информации с высокой скоростью, сохраняя точность и глубину анализа. Благодаря открытому коду и весам, компании могут дообучать модель в своих защищённых системах, не рискуя утечкой конфиденциальных данных.

GigaChat Lightning, напротив, представляет собой компактную и максимально производительную MoE-модель, ориентированную на запуск на персональных устройствах, таких как ноутбуки. Она идеально подходит для быстрого прототипирования и внедрения в продукты. Lightning превосходит аналогичные модели, включая Qwen3-4B, по точности в русскоязычных задачах и демонстрирует схожую эффективность при меньших ресурсных затратах. Интересно, что Lightning почти в шесть раз больше Qwen3-1.7B, но при этом работает с сопоставимой скоростью, что стало возможным благодаря технологии ускоренного инференса, также выложенной в открытый доступ.

Помимо языковых моделей, «Сбер» представил обновлённую версию своей мультимодальной системы генерации визуального контента Kandinsky 5.0. В неё входят модели Video Pro, Video Lite и Image Lite, способные создавать изображения и видео по текстовому описанию, пониманию контекста и с учётом культурных особенностей русскоязычного пространства. Эти нейросети нативно интерпретируют запросы на русском языке и умеют генерировать изображения и видео с корректным кириллическим текстом. Кроме того, в комплект входят модели для эффективного сжатия визуальных данных K-VAE 1.0, признанные лучшими в мире среди аналогичных открытых решений.

Также была представлена новая версия моделей GigaAM-v3 — системы для автоматического распознавания речи. Эти модели не только точно транскрибируют голос в текст, но и автоматически расставляют пунктуацию и нормализуют речь, что делает их особенно полезными в бизнес-процессах, документообороте и создании интеллектуальных ассистентов.

Андрей Белевцев, старший вице-президент и руководитель блока технологического развития Сбербанка, подчеркнул, что открытие доступов к моделям — это не просто жест доброй воли, а фундаментальная часть стратегии по построению технологического суверенитета страны. По его словам, ИИ мирового уровня требует не только мощной инфраструктуры, но и высококлассных исследовательских команд. Всё это у Сбера есть, и теперь, открыв модели, банк даёт возможность любому бизнесу в России использовать передовые технологии в рамках своего периметра, обеспечивая безопасность и контроль над данными.

Особенности новых моделей не ограничиваются только производительностью и открытостью. Они также интегрируют дополнительные функции, такие как поддержка инструментов кода и памяти. Инструмент «Код» позволяет выполнять программные операции, визуализировать данные, строить графики и проводить аналитические расчёты прямо внутри модели. Это особенно важно для научных исследований, образовательных платформ и аналитических систем.

Функция «Память» делает взаимодействие с ИИ более персонализированным. Модель способна запоминать предпочтения пользователя, цели, важные факты и историю общения, что позволяет строить более осмысленные и продуктивные диалоги. При этом устаревшие или чувствительные данные могут быть удалены, а пользователь имеет возможность вручную управлять содержанием памяти.

Открытие таких моделей даёт мощный импульс для развития локальной ИТ-инфраструктуры. Компании получают возможность разрабатывать собственные продукты на основе открытого ИИ, интегрировать его в CRM-системы, голосовых помощников, корпоративные чат-боты и аналитические платформы. Это особенно актуально в условиях, когда вопросы безопасности, импортозамещения и автономности становятся приоритетными.

Кроме того, доступность моделей на базе открытого кода обеспечивает прозрачность и надёжность решений: разработчики могут проверить архитектуру, адаптировать её под свои задачи или объединить с другими технологиями. Это создаёт основу для коллабораций между компаниями, научными учреждениями и образовательными организациями.

На фоне глобальных трендов в области искусственного интеллекта, где крупные западные компании всё чаще закрывают свои решения или ограничивают доступ к ним, шаг «Сбера» в сторону открытости выглядит особенно значимым. Это позволяет России не только догонять, но и опережать конкурентов в определённых сегментах ИИ, особенно в задачах, связанных с русским языком и культурой.

Таким образом, открытие передовых нейросетевых моделей GigaChat и Kandinsky, а также технологий для распознавания речи и визуального анализа, закладывает прочный фундамент для формирования независимой цифровой экосистемы. Это важный шаг к тому, чтобы высокие технологии стали доступными каждому бизнесу внутри страны — от крупного банка до небольшого стартапа.

Прокрутить вверх