Перейти к содержанию

Microsoft создала программу перевода речи с сохранением голоса


Рекомендуемые сообщения

Компания Microsoft разрабатывает мгновенный переводчик, который работает как человеческий мозг.

 

Крупнейшая в мире ИТ-компания Microsoft завершает работу над технологией, которая позволяет распознавать речь, переводить ее на другой язык и воспроизводить ее на новом языке с сохранением особенностей голоса того, кто говорит, написал в корпоративном блоге директор Microsoft по разработке Рик Рашид, сообщает TCH.ua.

 

Рашид впервые продемонстрировал работу технологии, выступая на презентации в Китае. Сначала его речь распознавалась в реальном времени и выводилась на экран в виде обновляемого текста на английском языке.

 

Финальным этапом стал голосовой перевод его речи - Рашид произносил предложения на английском языке, а программа воспроизводила их на китайском с сохранением особенностей голоса топ-менеджера Microsoft.

 

 

"Наиболее значительным является то, что мы добились важной цели - смогли позволить англоязычному человеку, похожему на меня, провести презентацию на китайском, сохраняя свой голос", - отметил Рашид.

 

Данная технология явилась результатом совместных исследований корпорации Microsoft и университета Торонто. Несмотря на то, что специалисты усердно работали над программой в течение двух лет, программе не удается избежать некоторых ошибок, в частности при воспроизведении она ошибается на одном слове из семи-восьми, отмечает Devicebox.

 

Рашид признал наличие ошибок и отметил, что в течение ближайших лет эти упущения в программе будут устранены и появится беспрецедентная возможность практически полностью устранить языковой барьер. На вопрос о том, будет ли программа платной, и какова будет её стоимость, директор по разработкам не ответил.

 

Компания экспериментировала со статистическими моделями, которые способны лучше захватить вокальный диапазон человека. Перевод был неправильным в каждом четвертом слове, но компания Microsoft продолжала работать, и после некоторого периода работы с учеными из университета Торонто в 2010 году, они обнаружили, что они могли бы использовать технику, называемую Deep Neural Network, добавляет WorldScience.

 

Рашид пишет, что это было сделано "по образцу человеческого поведения мозга", в результате чего значительно улучшился процент успеха.

Ссылка на комментарий
Поделиться на другие сайты

Она же не сможет озвучить любую фразу при первом запуске, потому что в свежепереведенном тексте будут присутствовать звуки, отсутствующие в оригинальной фразе. Скорее всего, программа будет самообучающейся или будет что-то вроде калибровки, чтобы иметь базу данных по голосу.

 

Кстати, аналогичные программы с озвучкой переведенного текста (но другим голосом) уже есть + японцы разрабатывают программу, которая будет переводить речь прямо в процессе разговора по телефону, т.е. можно будет спокойно общаться с иностранцами.

Изменено пользователем Spid3r
Ссылка на комментарий
Поделиться на другие сайты

Для публикации сообщений создайте учётную запись или авторизуйтесь

Вы должны быть пользователем, чтобы оставить комментарий

Создать учетную запись

Зарегистрируйте новую учётную запись в нашем сообществе. Это очень просто!

Регистрация нового пользователя

Войти

Уже есть аккаунт? Войти в систему.

Войти
  • Последние посетители   0 пользователей онлайн

    • Ни одного зарегистрированного пользователя не просматривает данную страницу
×
×
  • Создать...