Люксембург научился синтезировать люксембургскую речь

Jason Rosewell, Unsplash
10 февраля 2025 года министр культуры Эрик Тиль (Eric Thill) представил sproochmaschinn.lu – первую цифровую платформу для автоматической транскрипции (Speech-to-Text) и синтеза речи (Text-to-Speech) на люксембургском языке.** Этот проект, разработанный Zenter fir d'Lëtzebuerger Sprooch (ZLS, Центр люксембургского языка), знаменует важный шаг в применении искусственного интеллекта для поддержки национального языка.
Первая версия инструмента для распознавания речи была запущена еще в 2022 году, но с тех пор система претерпела значительные улучшения. Новая версия:
- делает меньше ошибок,
- лучше распознает разные региональные диалекты,
- может работать с длинными аудиофайлами.
Пользователь загружает аудиозапись, после чего система автоматически преобразует ее в текст. Интерфейс позволяет следить за процессом и скачивать результат в виде обычного текста или файла с временными метками, что удобно для создания субтитров.
Нововведением платформы стала функция синтеза речи – возможность превращать текст в естественно звучащую озвучку. В основе лежит искусственный интеллект, обученный на материалах Lëtzebuerger Online Dictionnaire (LOD, Люксембургский онлайн-словарь).
Главная особенность: машина говорит голосом реального человека. Для обучения использовались записи Макса Куборна (Max Kuborn), известного сотрудника RTL, благодаря чему синтетический голос звучит более естественно.
Этот инструмент может быть особенно полезен для:
- людей с ослабленным зрением,
- автоматического озвучивания текстов для образовательных и медийных целей.
Пользователям рекомендуется тщательно проверять орфографию перед обработкой текста, так как система лучше работает с правильно написанными словами.
На данный момент система испытывает сложности с:
- заимствованными словами и иностранными терминами,
- собственными именами (географическими названиями, именами людей, названиями организаций),
- аббревиатурами.
Разработчики просят пользователей сообщать о проблемах, чтобы усовершенствовать технологию.
Министр культуры Эрик Тиль подчеркнул, что sproochmaschinn.lu – важный шаг в стратегии поддержки люксембургского языка. Он также заверил, что в системе не хранятся данные пользователей, что гарантирует защиту персональной информации.
Платформа уже доступна для тестирования, а в будущем может использоваться в бизнесе, образовании и государственных сервисах.
Запуск sproochmaschinn.lu – значимый шаг для цифрового будущего люксембургского языка. Теперь текст можно не только переводить в речь, но и записывать голосом, близким к человеческому. Проект открывает новые возможности для образования, доступности и технологического развития.