Сбер открыл доступ к ИИ-моделям giga-embeddings и kandinsky для текста и видео

«Сбер» открыл доступ к двум новым моделям искусственного интеллекта, предназначенным для создания векторных представлений текста и генерации видео. Это стало важным шагом в развитии отечественных технологий и их интеграции в глобальное open-source-сообщество. Модели Giga-Embeddings и Kandinsky Video Lite теперь доступны всем разработчикам и компаниям, включая коммерческие проекты, без ограничений по масштабу.

Обновлённая модель Giga-Embeddings предназначена для преобразования текстовой информации в векторное представление, что критически важно для построения современных интеллектуальных систем. Она ориентирована на работу с русским языком и признана лидером по качеству среди аналогов. В известном бенчмарке ruMTEB модель заняла первое место, набрав 74.1 балла, уверенно обогнав все существующие открытые решения. При этом Giga-Embeddings демонстрирует высокую эффективность и при работе с английским языком, что делает её универсальным решением для многоязычных проектов.

Модель Kandinsky Video Lite представляет собой компактную систему генерации видео на основе текстовых запросов. Она способна создавать ролики продолжительностью до 10 секунд, используя всего два миллиарда параметров. Несмотря на такую компактность, модель успешно конкурирует с более громоздкими аналогами, включая знаменитую Sora и модели линейки Wan. По качеству визуала, динамики и соответствия текстовому запросу Kandinsky Video Lite не уступает значительно более крупным решениям, превосходя их во многих аспектах. Визуальное качество модели сравнимо с Wan 2.2 A14B, при этом Kandinsky легче в 13–14 раз.

Особое внимание при обучении Kandinsky Video Lite было уделено пониманию специфики российской культуры. Для этого был сформирован обширный датасет из более чем миллиона изображений и видеоматериалов, отобранных вручную экспертами в области дизайна и искусства. Это позволило модели лучше распознавать элементы, характерные для российской действительности и культурного контекста, делая её особенно ценной для локальных проектов.

В дополнение к основной версии, «Сбер» также представил Kandinsky Video Lite Flash — ускоренный вариант модели, работающий примерно в шесть раз быстрее. Это решение ориентировано на применение в проектах, где важна высокая скорость генерации без существенной потери качества.

По словам Андрея Белевцева, старшего вице-президента и руководителя блока «Технологическое развитие» Сбербанка, открытие доступа к этим моделям отражает стремление компании ускорить развитие ИИ-технологий в России и внести вклад в глобальное сообщество разработчиков. Это также способствует формированию технологических стандартов в области обработки естественного языка и укреплению международной позиции страны в сфере высоких технологий.

Giga-Embeddings особенно ценна для построения RAG-архитектур (Retrieval-Augmented Generation) — систем, которые совмещают генерацию и поиск информации. Это гарантирует более точные и надёжные ответы, основанные на актуальных источниках. Таким образом, компании могут создавать интеллектуальных помощников и чат-ботов, которые эффективно решают задачи поддержки клиентов, анализа текстов и работы с корпоративными базами знаний.

Новые инструменты от «Сбера» открывают широкие возможности для исследователей, разработчиков, стартапов и представителей креативных индустрий. Благодаря открытой лицензии, их можно свободно использовать в коммерческих продуктах, что особенно важно для малых и средних компаний, не располагающих значительными вычислительными ресурсами.

Открытие исходных кодов и весов моделей также создаёт условия для расширения круга участников разработки. Исследователи могут адаптировать модели под специфические задачи, обучать их на собственных данных, улучшать архитектуру и вносить вклад в дальнейшее развитие отечественных ИИ-разработок.

Кроме того, подобные инициативы способствуют снижению зависимости от иностранных технологий. В условиях растущей важности технологического суверенитета, использование отечественных решений становится стратегическим приоритетом, особенно в таких направлениях, как государственные системы, образование и медицина.

Для образовательных учреждений открытый доступ к таким моделям — это возможность обучать студентов на передовых инструментах, приближая учебный процесс к реальным задачам индустрии. Это также может дать импульс развитию исследовательской деятельности в университетах и научных центрах.

Модели уже доступны на популярных платформах для запуска и тестирования. Использование их в различных сферах — от маркетинга до автоматизации бизнес-процессов — позволит повысить производительность и качество цифровых решений без необходимости разрабатывать всё с нуля.

Таким образом, шаг «Сбера» по открытию двух мощных ИИ-моделей в открытый доступ не только демонстрирует высокий уровень отечественных разработок, но и создаёт прочную основу для роста всей экосистемы искусственного интеллекта в России и за её пределами.

Прокрутить вверх