Полтора года назад Украина сделала стратегическую заявку на вход в глобальную гонку искусственного интеллекта — не как потребитель, а как разработчик собственной фундаментальной AI-инфраструктуры. Как уже писал Ukrainian Wall, инициатором проекта выступило Министерство цифровой трансформации, которое поставило вопрос цифрового суверенитета: если ИИ все больше влияет на экономику, оборону и управление, страна без собственной модели оказывается в технологической зависимости.

В центре этой амбиции — большая языковая модель (LLM), получившая название «Сяйво». Изначальный график предполагал, что первые результаты покажут уже в конце 2025-го, а весной 2026 года модель станет доступной для публичного тестирования. Однако все пошло не по плану — сроки сдвинули, архитектуру пересмотрели, а запуск отложили как минимум до конца года.

Государство плюс «Киевстар»: как устроено партнерство

Проект реализуется по государственно-частной модели. Именно оператор мобильной связи «Киевстар» взял на себя финансирование, формирование технической команды и инженерную разработку. Государство со своей стороны отвечает за координацию, доступ к данным и формирование этических и правовых рамок. На бумаге такой подход должен был ускорить запуск, однако на практике оказался значительно сложнее.

Первым серьезным препятствием стали данные. Для обучения LLM нужны огромные массивы текстов — и хотя Украина имеет значительный ресурс в виде архивов, медиа, научных работ и государственных документов, значительная часть этих материалов юридически защищена или физически не оцифрована. Пришлось создавать систему анонимизации, очистки данных и юридической проверки, чтобы избежать нарушения авторских прав.

Вторым вызовом стал кадровый голод. Специалистов с опытом тренировки больших языковых моделей в Украине мало, а глобальный рынок таких специалистов чрезвычайно конкурентен. Команду пришлось формировать из инженеров смежных направлений, которых дополнительно обучали специфике LLM-разработки, и параллельно привлекать внешних консультантов. Формирование полноценной команды растянулось на месяцы.

TPU вместо GPU и переход на Gemma 4

Технически украинская LLM строится не на классических для индустрии графических процессорах Nvidia, а на инфраструктуре Google TPU. Это означало не только другой стек технологий, но и необходимость перестройки части процессов обучения моделей. Сейчас команда завершает работу над первой, малой моделью примерно на четыре миллиарда параметров — это технический полигон для отработки всех ключевых процессов.

Следующий шаг станет решающим. Если изначально планировали три последовательных уровня — малая, средняя и большая модель, — то теперь команда решила пропустить промежуточную стадию и сразу перейти к масштабной системе. Базой для нее должна стать современная модель Google Gemma 4, которая значительно превосходит предыдущие версии по логике, математике и работе с длинными контекстами. Однако уже созданный украинский токенайзер теперь придется адаптировать к новой архитектуре — это фактически повторная часть работы.

Отдельный акцент сделан на украинском языке. Сегодня большинство глобальных моделей обрабатывают украинские запросы через англоязычный «промежуточный слой», что приводит к потере нюансов и стилистики. Команда «Сяйва» формирует специализированные украиноязычные корпуса данных объемом в десятки терабайт, чтобы модель работала с языком напрямую.

AI Factory и что дальше

Параллельно государство строит собственную AI-инфраструктуру в рамках проекта AI Factory — GPU-узлы, системы охлаждения и хранилища данных. Часть оборудования уже закуплена, а в перспективе инфраструктура должна расшириться до десятков вычислительных кластеров. Обновленный график предполагает, что большая украинская LLM может быть готова к тестированию примерно в конце 2026 года, после чего ее передадут государству и развернут на национальной инфраструктуре.

К правовой рамке проекта привлечены десятки институций — от медиа и университетов до издательств и архивов. Формируется система национальных бенчмарков, которая будет оценивать не только точность, но и этичность работы модели. Параллельно в Верховной Раде уже начата работа над первым законом об искусственном интеллекте в Украине.

Ранее Ukrainian Wall писал: ШІ проти росії на фронті: які технології вже працюють і хто за цим стоїть.

Мы уже сообщали: пустят не всех: в Украине запускают фонд для инвестиций в оборонные технологии — кого коснется.