Microsoft создала программу перевода речи с сохранением голоса

12 ноября, 2012

Компания Microsoft разрабатывает мгновенный переводчик, который работает как человеческий мозг.

Крупнейшая в мире ИТ-компания Microsoft завершает работу над технологией, которая позволяет распознавать речь, переводить ее на другой язык и воспроизводить ее на новом языке с сохранением особенностей голоса того, кто говорит, написал в корпоративном блоге директор Microsoft по разработке Рик Рашид, сообщает TCH.ua.

Рашид впервые продемонстрировал работу технологии, выступая на презентации в Китае. Сначала его речь распознавалась в реальном времени и выводилась на экран в виде обновляемого текста на английском языке.

Финальным этапом стал голосовой перевод его речи - Рашид произносил предложения на английском языке, а программа воспроизводила их на китайском с сохранением особенностей голоса топ-менеджера Microsoft.

"Наиболее значительным является то, что мы добились важной цели - смогли позволить англоязычному человеку, похожему на меня, провести презентацию на китайском, сохраняя свой голос", - отметил Рашид.

Данная технология явилась результатом совместных исследований корпорации Microsoft и университета Торонто. Несмотря на то, что специалисты усердно работали над программой в течение двух лет, программе не удается избежать некоторых ошибок, в частности при воспроизведении она ошибается на одном слове из семи-восьми, отмечает Devicebox.

Рашид признал наличие ошибок и отметил, что в течение ближайших лет эти упущения в программе будут устранены и появится беспрецедентная возможность практически полностью устранить языковой барьер. На вопрос о том, будет ли программа платной, и какова будет её стоимость, директор по разработкам не ответил.

Компания экспериментировала со статистическими моделями, которые способны лучше захватить вокальный диапазон человека. Перевод был неправильным в каждом четвертом слове, но компания Microsoft продолжала работать, и после некоторого периода работы с учеными из университета Торонто в 2010 году, они обнаружили, что они могли бы использовать технику, называемую Deep Neural Network, добавляет WorldScience.

Рашид пишет, что это было сделано "по образцу человеческого поведения мозга", в результате чего значительно улучшился процент успеха.

12 ноября, 2012

Она же не сможет озвучить любую фразу при первом запуске, потому что в свежепереведенном тексте будут присутствовать звуки, отсутствующие в оригинальной фразе. Скорее всего, программа будет самообучающейся или будет что-то вроде калибровки, чтобы иметь базу данных по голосу.

Кстати, аналогичные программы с озвучкой переведенного текста (но другим голосом) уже есть + японцы разрабатывают программу, которая будет переводить речь прямо в процессе разговора по телефону, т.е. можно будет спокойно общаться с иностранцами.

Изменено 12 ноября, 2012 пользователем Spid3r

Войти

Microsoft создала программу перевода речи с сохранением голоса

Рекомендуемые сообщения

tweestr

Ссылка на комментарий

Поделиться на другие сайты

Spid3r

Ссылка на комментарий

Поделиться на другие сайты

Пожалуйста, войдите, чтобы комментировать

Последние посетители 0 пользователей онлайн

Сообщения

Представительства

Обзор

Активность

Социальные сети

Видео и трансляции