Полтора года назад Украина сделала стратегическую заявку на вход в глобальную гонку искусственного интеллекта — не как потребитель, а как разработчик собственной фундаментальной AI-инфраструктуры. Как уже писал Ukrainian Wall, инициатором проекта выступило Министерство цифровой трансформации, которое поставило вопрос цифрового суверенитета: если ИИ все больше влияет на экономику, оборону и управление, страна без собственной модели оказывается в технологической зависимости.
В центре этой амбиции — большая языковая модель (LLM), получившая название «Сяйво». Изначальный график предполагал, что первые результаты покажут уже в конце 2025-го, а весной 2026 года модель станет доступной для публичного тестирования. Однако все пошло не по плану — сроки сдвинули, архитектуру пересмотрели, а запуск отложили как минимум до конца года.
Государство плюс «Киевстар»: как устроено партнерство
Проект реализуется по государственно-частной модели. Именно оператор мобильной связи «Киевстар» взял на себя финансирование, формирование технической команды и инженерную разработку. Государство со своей стороны отвечает за координацию, доступ к данным и формирование этических и правовых рамок. На бумаге такой подход должен был ускорить запуск, однако на практике оказался значительно сложнее.
Первым серьезным препятствием стали данные. Для обучения LLM нужны огромные массивы текстов — и хотя Украина имеет значительный ресурс в виде архивов, медиа, научных работ и государственных документов, значительная часть этих материалов юридически защищена или физически не оцифрована. Пришлось создавать систему анонимизации, очистки данных и юридической проверки, чтобы избежать нарушения авторских прав.
Вторым вызовом стал кадровый голод. Специалистов с опытом тренировки больших языковых моделей в Украине мало, а глобальный рынок таких специалистов чрезвычайно конкурентен. Команду пришлось формировать из инженеров смежных направлений, которых дополнительно обучали специфике LLM-разработки, и параллельно привлекать внешних консультантов. Формирование полноценной команды растянулось на месяцы.
TPU вместо GPU и переход на Gemma 4
Технически украинская LLM строится не на классических для индустрии графических процессорах Nvidia, а на инфраструктуре Google TPU. Это означало не только другой стек технологий, но и необходимость перестройки части процессов обучения моделей. Сейчас команда завершает работу над первой, малой моделью примерно на четыре миллиарда параметров — это технический полигон для отработки всех ключевых процессов.
Следующий шаг станет решающим. Если изначально планировали три последовательных уровня — малая, средняя и большая модель, — то теперь команда решила пропустить промежуточную стадию и сразу перейти к масштабной системе. Базой для нее должна стать современная модель Google Gemma 4, которая значительно превосходит предыдущие версии по логике, математике и работе с длинными контекстами. Однако уже созданный украинский токенайзер теперь придется адаптировать к новой архитектуре — это фактически повторная часть работы.
Отдельный акцент сделан на украинском языке. Сегодня большинство глобальных моделей обрабатывают украинские запросы через англоязычный «промежуточный слой», что приводит к потере нюансов и стилистики. Команда «Сяйва» формирует специализированные украиноязычные корпуса данных объемом в десятки терабайт, чтобы модель работала с языком напрямую.
AI Factory и что дальше
Параллельно государство строит собственную AI-инфраструктуру в рамках проекта AI Factory — GPU-узлы, системы охлаждения и хранилища данных. Часть оборудования уже закуплена, а в перспективе инфраструктура должна расшириться до десятков вычислительных кластеров. Обновленный график предполагает, что большая украинская LLM может быть готова к тестированию примерно в конце 2026 года, после чего ее передадут государству и развернут на национальной инфраструктуре.
К правовой рамке проекта привлечены десятки институций — от медиа и университетов до издательств и архивов. Формируется система национальных бенчмарков, которая будет оценивать не только точность, но и этичность работы модели. Параллельно в Верховной Раде уже начата работа над первым законом об искусственном интеллекте в Украине.
Ранее Ukrainian Wall писал: ШІ проти росії на фронті: які технології вже працюють і хто за цим стоїть.
Мы уже сообщали: пустят не всех: в Украине запускают фонд для инвестиций в оборонные технологии — кого коснется.