Прoгрaммисты из Унивeрситeтa Восточной Англии разработали компьютерную программу, которая может распознавать речь по видеозаписи движения губ, сообщает GT.
Система может помочь при расследовании преступлений или различных происшествий — особенно в тех, случаях, когда аудиодорожка отсутствует, оказывается повреждена или является бесполезной из-за фонового шума.
Видеозаписи в местах развлечений, в автомобилях или кабинах самолётов и других транспортных средств, делаются без аудиодорожки, либо аудио содержит слишком много шума. В сложных случаях следователи приглашают специалиста по чтению по губам — обычно это глухие люди, или те, кто работает с глухими.
Чтение по губам — более сложная задача, чем распознавание речи, как для человека, так и для компьютера. Некоторые буквы, особенно гласные, хорошо распознаются при их произнесении. Некоторые (например: к, г, х) вообще "не видны" снаружи. Опытный человек, распознающий речь, подбирает подходящие слова и достраивает предложения по смыслу.
"Пока что мы ещё только постигаем науку распознавания визуальной речи и того, что необходимо для создания надёжной системы распознавания",- говорит Хелен Беар, одна из создателей системы.
"Чтение по губам — одна из самых сложных задач для искусственного интеллекта, поэтому так здорово совершать прогресс в этой области в таких сложных вещах, как обучение машины распознаванию внешнего вида и формы губ человека",- поясняет Ричард Харви, профессор, участвовавший в создании системы.
Как сообщал MIGnews.com.ua ранее, история, которую сочинил искусственный интеллект (ИИ), прошла первый раунд японского литературного конкурса Nikkei Shinichi Hoshi Literary Award.