Півтора року тому Україна зробила стратегічну заявку на вхід у глобальну гонку штучного інтелекту — не як споживач, а як розробник власної фундаментальної AI-інфраструктури. Як уже писав Ukrainian Wall, ініціатором проєкту виступило Міністерство цифрової трансформації, яке поставило питання цифрового суверенітету: якщо ШІ дедалі більше впливає на економіку, оборону та управління, країна без власної моделі опиняється в технологічній залежності.

У центрі цієї амбіції — велика мовна модель (LLM), яка отримала назву «Сяйво». Початковий графік передбачав, що перші результати покажуть уже наприкінці 2025-го, а навесні 2026 року модель стане доступною для публічного тестування. Однак усе пішло не за планом — строки зсунули, архітектуру переглянули, а запуск відклали щонайменше до кінця року.

Держава плюс «Київстар»: як влаштоване партнерство

Проєкт реалізується за державно-приватною моделлю. Саме оператор мобільного зв'язку «Київстар» узяв на себе фінансування, формування технічної команди та інженерну розробку. Держава зі свого боку відповідає за координацію, доступ до даних і формування етичних та правових рамок. На папері такий підхід мав пришвидшити запуск, однак на практиці виявився значно складнішим.

Першою серйозною перепоною стали дані. Для навчання LLM потрібні величезні масиви текстів — і хоча Україна має значний ресурс у вигляді архівів, медіа, наукових робіт та державних документів, значна частина цих матеріалів юридично захищена або фізично не оцифрована. Довелося створювати систему анонімізації, очищення даних і юридичної перевірки, щоб уникнути порушення авторських прав.

Другим викликом став кадровий голод. Фахівців із досвідом тренування великих мовних моделей в Україні обмаль, а глобальний ринок таких спеціалістів надзвичайно конкурентний. Команду довелося формувати з інженерів суміжних напрямів, яких додатково навчали специфіці LLM-розробки, і паралельно залучати зовнішніх консультантів. Формування повноцінної команди розтягнулося на місяці.

TPU замість GPU та перехід на Gemma 4

Технічно українська LLM будується не на класичних для індустрії графічних процесорах Nvidia, а на інфраструктурі Google TPU. Це означало не лише інший стек технологій, а й необхідність перебудови частини процесів навчання моделей. Зараз команда завершує роботу над першою, малою моделлю приблизно на чотири мільярди параметрів — це технічний полігон для відпрацювання всіх ключових процесів.

Наступний крок стане вирішальним. Якщо спочатку планували три послідовні рівні — мала, середня та велика модель, — то тепер команда вирішила пропустити проміжну стадію й одразу перейти до масштабної системи. Базою для неї має стати сучасна модель Google Gemma 4, яка значно перевершує попередні версії за логікою, математикою та роботою з довгими контекстами. Проте вже створений український токенайзер тепер доведеться адаптувати до нової архітектури — це фактично повторна частина роботи.

Окремий акцент зроблено на українській мові. Сьогодні більшість глобальних моделей опрацьовують українські запити через англомовний «проміжний шар», що призводить до втрати нюансів і стилістики. Команда «Сяйва» формує спеціалізовані українськомовні корпуси даних обсягом у десятки терабайтів, щоб модель працювала з мовою напряму.

AI Factory і що далі

Паралельно держава будує власну AI-інфраструктуру в межах проєкту AI Factory — GPU-вузли, системи охолодження та сховища даних. Частину обладнання вже закуплено, а в перспективі інфраструктура має розширитися до десятків обчислювальних кластерів. Оновлений графік передбачає, що велика українська LLM може бути готова до тестування приблизно наприкінці 2026 року, після чого її передадуть державі та розгорнуть на національній інфраструктурі.

До правової рамки проєкту залучені десятки інституцій — від медіа та університетів до видавництв і архівів. Формується система національних бенчмарків, яка оцінюватиме не лише точність, а й етичність роботи моделі. Паралельно у Верховній Раді вже розпочато роботу над першим законом про штучний інтелект в Україні.

Раніше Ukrainian Wall писав: ШІ проти росії на фронті: які технології вже працюють і хто за цим стоїть.

Ми вже повідомляли: пустять не всіх: в Україні запускають фонд для інвестицій в оборонні технології — кого торкнеться.