Мінреінтеграції ініціювало створення Національного корпусу кримськотатарської мови (НККМ) у межах реалізації Стратегії розвитку кримськотатарської мови на 2022—2032 роки. НККМ — це онлайн-платформа для дослідження мови, що працюватиме на даних з текстових матеріалів кримськотатарською, повідомляє Міністерство з питань реінтеграції тимчасово окупованих територій.
Збирання друкованих та електронних текстів кримськотатарською мовою для створення корпусу розпочалося із жовтня 2022 року. За майже вісім місяців до каталогу було внесено більш ніж 800 матеріалів понад 200 авторів. Процедуру розпізнавання та форматування пройшли вже 54% матеріалів. До завантаження на платформу корпусу підготовлено 25% запланованого обсягу матеріалів. Нині завершують тестування програмних елементів платформи і готують інструкцію для її майбутніх користувачів.
Проєкт Національного корпусу кримськотатарської мови було представлено на 17-й конференції Європейського відділення Асоціації комп’ютерної лінгвістики, яка відбулася цього місяця в Хорватії. Його реалізують за підтримки Мінреінтеграції, швейцарсько-української програми EGAP, що виконує Фонд «Східна Європа», та Київського національного університету імені Тараса Шевченка.