Перейти к содержанию

Microsoft создала программу перевода речи с сохранением голоса


Рекомендуемые сообщения

Компания Microsoft разрабатывает мгновенный переводчик, который работает как человеческий мозг.

 

Крупнейшая в мире ИТ-компания Microsoft завершает работу над технологией, которая позволяет распознавать речь, переводить ее на другой язык и воспроизводить ее на новом языке с сохранением особенностей голоса того, кто говорит, написал в корпоративном блоге директор Microsoft по разработке Рик Рашид, сообщает TCH.ua.

 

Рашид впервые продемонстрировал работу технологии, выступая на презентации в Китае. Сначала его речь распознавалась в реальном времени и выводилась на экран в виде обновляемого текста на английском языке.

 

Финальным этапом стал голосовой перевод его речи - Рашид произносил предложения на английском языке, а программа воспроизводила их на китайском с сохранением особенностей голоса топ-менеджера Microsoft.

 

 

"Наиболее значительным является то, что мы добились важной цели - смогли позволить англоязычному человеку, похожему на меня, провести презентацию на китайском, сохраняя свой голос", - отметил Рашид.

 

Данная технология явилась результатом совместных исследований корпорации Microsoft и университета Торонто. Несмотря на то, что специалисты усердно работали над программой в течение двух лет, программе не удается избежать некоторых ошибок, в частности при воспроизведении она ошибается на одном слове из семи-восьми, отмечает Devicebox.

 

Рашид признал наличие ошибок и отметил, что в течение ближайших лет эти упущения в программе будут устранены и появится беспрецедентная возможность практически полностью устранить языковой барьер. На вопрос о том, будет ли программа платной, и какова будет её стоимость, директор по разработкам не ответил.

 

Компания экспериментировала со статистическими моделями, которые способны лучше захватить вокальный диапазон человека. Перевод был неправильным в каждом четвертом слове, но компания Microsoft продолжала работать, и после некоторого периода работы с учеными из университета Торонто в 2010 году, они обнаружили, что они могли бы использовать технику, называемую Deep Neural Network, добавляет WorldScience.

 

Рашид пишет, что это было сделано "по образцу человеческого поведения мозга", в результате чего значительно улучшился процент успеха.

Ссылка на комментарий
Поделиться на другие сайты

Она же не сможет озвучить любую фразу при первом запуске, потому что в свежепереведенном тексте будут присутствовать звуки, отсутствующие в оригинальной фразе. Скорее всего, программа будет самообучающейся или будет что-то вроде калибровки, чтобы иметь базу данных по голосу.

 

Кстати, аналогичные программы с озвучкой переведенного текста (но другим голосом) уже есть + японцы разрабатывают программу, которая будет переводить речь прямо в процессе разговора по телефону, т.е. можно будет спокойно общаться с иностранцами.

Изменено пользователем Spid3r
Ссылка на комментарий
Поделиться на другие сайты

Пожалуйста, войдите, чтобы комментировать

Вы сможете оставить комментарий после входа в



Войти
  • Последние посетители   0 пользователей онлайн

    • Ни одного зарегистрированного пользователя не просматривает данную страницу
×
×
  • Создать...