Институт интеллектуальных систем и искусственного интеллекта (ISSAI) Назарбаев Университета запустил проект по автоматическому распознаванию казахской речи. С его помощью казахский язык может быть активно интегрирован в глобальный цифровой мир, сообщает «Ұлт ақпарат» со ссылкой на пресс-службу университета.
Для реализации проекта ученые собрали самый большой набор звуковых данных на казахском языке – 300 часов записей более 2000 человек.
Применение этого исследования открывает новые возможности, такие как распознавание казахской речи с помощью виртуальных помощников, использование в различных программах и технологиях «умного дома».
Кроме того, этот проект даст большой импульс развитию инклюзии в Казахстане. Новая технология может быть использована в голосовых и текстовых программах, широко применяемых людьми с особыми потребностями.
«Ранее недостаток больших наборов данных ограничивал возможности казахского языка в цифровом мире, поэтому мы реализовали этот проект. Теперь мы готовы поделиться набором звуковых данных на казахском языке с открытым исходным кодом со всеми исследователями и предпринимателями, надеясь, что это будет полезно для развития экономики и общества», – говорит директор ISSAI NU, профессор Атакан Варол.
Запуск проекта был приурочен к годовщине основания Института интеллектуальных систем и искусственного интеллекта Назарбаев Университета. 14 сентября ISSAI отметил свой первый день рождения.
По следующей ссылке можно ознакомиться с набором голосовых данных на казахском языке, а также протестировать систему автоматического распознавания казахской речи.