Конвертация речи в текст онлайн: Преобразование речи в текст

Содержание

Как онлайн перевести речь в текст? Выбираем лучший бесплатный сервис распознавания речи

28.05.2022
Сергей Сандаков

Для того, чтобы распознать речь и перевести её из аудио или видео в текст, существуют программы и расширения (плагины) для браузеров. Однако зачем всё это, если есть онлайн сервисы? Программы надо устанавливать на компьютер, более того, большинство программ распознавания речи далеко не бесплатны.

Большое число установленных в браузере плагинов сильно тормозит его работу и скорость серфинга в интернет. А сервисы, о которых сегодня пойдет речь, полностью бесплатны и не требуют установки – зашел, попользовался и ушел!

  1. Speechpad.ru
  2. Dictation.io
  3. Сравнительный тест сервисов

В этой статье мы рассмотрим два сервиса перевода речи в текст онлайн. Оба они работают по схожему принципу: Вы запускаете запись (разрешаете браузеру доступ к микрофону на время пользования сервисом), говорите в микрофон (диктуете), а на выходе получаете текст, который можно скопировать в любой документ на компьютере.

Speechpad.ru

Русскоязычный онлайн сервис распознавания речи. Имеет подробную инструкцию по работе на русском языке.

Среди основных функций «Голосового блокнота» (так сам автор называет свой сервис) следует выделить:

  • поддержку 7 языков (русский, украинский, английский, немецкий, французский, испанский, итальянский)
  • загрузку для транскрибации аудио или видео файла (поддерживаются ролики с YouTube)
  • синхронный перевод на другой язык
  • поддержку голосового ввода знаков препинания и перевода строки
  • панель кнопок (смена регистра, перевод на новую строку, кавычки, скобки и т.п.)
  • наличие персонального кабинета с историей записей (опция доступна после регистрации)
  • наличие плагина к Google Chrome для ввода текста голосом в текстовом поле сайтов (называется «Голосовой ввод текста — Speechpad.ru»)

Dictation.io

Второй онлайн сервис перевода речи в текст. Иностранный сервис, который между тем, прекрасно работает с русским языком, что крайне удивительно. По качеству распознавания речи не уступает Speechpad, но об этом чуть позже.

Основной функционал сервиса:

  • поддержка 30 языков, среди которых присутствуют даже венгерский, турецкий, арабский, китайский, малайский и пр.
  • автораспознавание произношения знаков препинания, перевода строки и пр.
  • возможность интеграции со страницами любого сайта
  • наличие плагина для Google Chrome (называется «VoiceRecognition»)

В деле распознавания речи самое важное значение имеет именно качество перевода речи в текст. Приятные «плюшки» и вохможности – не более чем хороший плюс. Так чем же могут похвастаться в этом плане оба сервиса?

Сравнительный тест сервисов

Для теста выберем два непростых для распознавания фрагмента, которые содержат нечасто употребляемые в нынешней речи слова и речевые обороты.  Для начала читаем фрагмент поэмы «Крестьянские дети» Н. Некрасова.

Ниже представлен результат перевода речи в текст каждым сервисом (ошибки обозначены красным цветом):

Как видим, оба сервиса практически с одинаковыми ошибками справились с распознаванием речи. Результат весьма неплохой!

Теперь для теста возьмем отрывок из письма красноармейца Сухова (к/ф «Белое солнце пустыни»):

Отличный результат!

Как видим, оба сервиса весьма достойно справляются с распознаванием речи – выбирайте любой!  Похоже что они даже используют один и тот же движок — уж слижком схожие у них оказались допущенные ошибки по результатам тестов ). Но если Вам необходимы дополнительные функции типа подгрузки аудио / видео файла и перевода его в текст (транскрибация) или синхронного перевода озвученного текста на другой язык, то Speechpad будет лучшим выбором!

Кстати вот как он выполнил синхронный перевод фрагмента поэмы Некрасова на английский язык:

Ну а это краткая видео инструкция по работе со Speechpad, записанная самим автором проекта:

Друзья, понравился ли Вам данный сервис? Знаете ли Вы более качественные аналоги? Делитесь своими впечатлениями в комментариях. Также хочу порекомендовать вам бесплатный сервис, который умеет не только распознавать текст, сказанный в микрофон, но и мгновенно переводить его на любой язык мира!

Понравилось? Поделитесь с друзьями!

Amazon Transcribe – Преобразование речи в текст – AWS

Примеры использования

Извлечение полезной информации из разговоров с клиентами

С Transcribe Call Analytics можно быстро извлекать полезную информацию из разговоров с клиентами. Партнеры Аналитики контакт-центра AWS и Contact Lens для Amazon Connect предлагают комплексные решения, чтобы повысить уровень вовлечения клиентов, увеличить продуктивность операторов и показывать руководителям предупреждения о контроле качества работы.

Поиск и анализ медиаконтента

Производители и распространители мультимедийного контента с помощью Amazon Transcribe могут автоматически конвертировать аудио и видео в архивы с возможностью полнотекстового поиска для выявления контента, выделения основных моментов, проверки контента и монетизации.

Создание субтитров и заметок для совещаний

Добавляйте субтитры к вашему контенту по требованию и к трансляции, чтобы повысить доступность и улучшить качество обслуживания клиентов. Используйте Amazon Transcribe для повышения производительности и точной фиксации хода важных встреч и совещаний.

Улучшение клинической информации

Лечащие и практикующие врачи могут использовать Amazon Transcribe Medical для быстрой и эффективной документации разговоров с пациентами, чтобы анализировать или вносить данные в электронную карту здоровья (EHR). Сервис соответствует требованиям HIPAA и умеет распознавать медицинскую терминологию.

Клиенты

NASCAR удалось создать субтитры к видеоконтенту по требованию с затратами на 97 % ниже рассчитанных »

С чего начать

Зайдите в консоль

Попробуйте использовать Amazon Transcribe в консоли AWS.

Начало работы »

Вход в Консоль

Подробнее об AWS

  • Что такое AWS?
  • Что такое облачные вычисления?
  • Многообразие, равенство и инклюзивность AWS
  • Что такое DevOps?
  • Что такое контейнер?
  • Что такое озеро данных?
  • Безопасность облака AWS
  • Новые возможности
  • Блоги
  • Пресс‑релизы

Ресурсы для работы с AWS

  • Начало работы
  • Обучение и сертификация
  • Портфолио решений AWS
  • Центр архитектурных решений
  • Вопросы и ответы по продуктам и техническим темам
  • Аналитические отчеты
  • Партнеры AWS

Разработчики на AWS

  • Центр разработчика
  • Пакеты SDK и инструментарий
  • . NET на AWS
  • Python на AWS
  • Java на AWS
  • PHP на AWS
  • JavaScript на AWS

Поддержка

  • Свяжитесь с нами
  • Обратиться в службу поддержки
  • Центр знаний
  • AWS re:Post
  • Обзор AWS Support
  • Юридическая информация
  • Работа в AWS

Amazon.com – работодатель равных возможностей. Мы предоставляем равные права
представителям меньшинств, женщинам, лицам с ограниченными возможностями, ветеранам боевых действий и представителям любых гендерных групп любой сексуальной ориентации независимо от их возраста.

Поддержка AWS для Internet Explorer заканчивается 07/31/2022. Поддерживаемые браузеры: Chrome, Firefox, Edge и Safari.
Подробнее »

Автоматически извлекать аудио из видеофайлов

Автоматически извлекать аудио из видеофайлов

Используйте для больших видеофайлов, чтобы уменьшить размер загрузки и сократить время загрузки

Выберите вашу операционную систему:

Вин 64 бит
Выиграй 32 бит
Мак

Выполните следующие действия, если вы используете 64-разрядную версию Windows:

  1. Нажмите следующую кнопку, чтобы загрузить файл . zip с именем speechnotes_ffmpeg.zip

    speechnotes_ffmpeg.zip

  2. Скопируйте speechnotes_ffmpeg.zip на жесткий диск C
  3. Распакуйте ZIP-файл.
  4. Убедитесь, что теперь у вас есть папка с именем speechnotes_ffmpeg непосредственно на жестком диске C . Если да — продолжайте.
  5. Нажмите следующую кнопку, чтобы загрузить файл .bat с именем speechnotes_audio_extractor.bat

    voicenotes_audio_extractor.bat

  6. Скопируйте speechnotes_audio_extractor.bat в любой каталог, содержащий видеофайлы, из которых вы хотите извлечь звук.
  7. Дважды щелкните скопированный файл speechnotes_audio_extractor.bat , чтобы запустить его. Он должен автоматически открыть окно командной строки и запуститься там.
  8. После завершения создается папка с именем soundnotes-output-audio-only , в которой находятся все извлеченные аудио только из видео.
  9. Больше видеофайлов находится в другом каталоге? Просто повторите ‘Копировать speechnotes_audio_extractor.bat в любой каталог…’  и далее с другим каталогом.

Дополнительные примечания

Поддерживаемые видеофайлы
  • .mp4
  • .mpeg
  • .avi
Нет жесткого диска C?

Вы можете использовать другой диск, но вам придется отредактировать файл .bat и заменить каждый «C://» выбранным диском.

Выполните следующие действия, если вы используете 32-разрядную версию Windows:

  1. Нажмите следующую кнопку, чтобы загрузить файл .zip с именем speechnotes_ffmpeg.zip

    речевые заметки_ffmpeg.zip

  2. Скопируйте speechnotes_ffmpeg.zip на жесткий диск C
  3. Распакуйте ZIP-файл.
  4. Убедитесь, что теперь у вас есть папка с именем speechnotes_ffmpeg непосредственно в вашем Жесткий диск C . Если да — продолжайте.
  5. Нажмите следующую кнопку, чтобы загрузить файл .bat с именем speechnotes_audio_extractor.bat

    speechnotes_audio_extractor.bat

  6. Скопируйте speechnotes_audio_extractor.bat в любой каталог, содержащий видеофайлы, из которых вы хотите извлечь звук.
  7. Дважды щелкните скопированный файл speechnotes_audio_extractor.bat , чтобы запустить его. Он должен автоматически открыть окно командной строки и запуститься там.
  8. После завершения создается папка с именем soundnotes-output-audio-only , в которой находятся все извлеченные аудио только из видео.
  9. Больше видеофайлов находится в другом каталоге? Просто повторите ‘Копировать speechnotes_audio_extractor.bat в любой каталог…’  и далее с другим каталогом.

Дополнительные примечания

Поддерживаемые видеофайлы
  • . mp4
  • .mpeg
  • .avi
Нет жесткого диска C?

Вы можете использовать другой диск, но вам придется отредактировать файл .bat и заменить каждый «C://» выбранным диском.

Выполните следующие действия, если вы используете Mac

* Обратите внимание, что эти инструкции потребуют от вас работы с терминалом командной строки. Это очень просто — мы проведем вас через каждый шаг с изображениями — так что, пожалуйста, не стесняйтесь. *

(1) Открытый терминал

На вашем Mac щелкните значок Launchpad в Dock или запустите «Поиск Spotlight», введите «Терминал» в поле поиска, затем нажмите «Терминал».

Щелкните значок панели запуска в Dock. Найдите «терминал» и щелкните его, чтобы открыть


(2) Установить homebrew и ffmpeg

(** Если на вашем Mac уже установлен ffmpeg, пропустите этот шаг и перейдите прямо к Got ffmpeg — давайте извлечем часть аудио)

(2a) Установка доморощенного

— Скопируйте следующее в свой терминал и нажмите «Enter» после этого:

/bin/bash -c "$(curl -fsSL https://raw. githubusercontent.com/Homebrew/install/master/install.sh)"

Окно терминала с текстом установки homebrew
— При запросе пароля введите пароль от компьютера (тот же пароль, что и для разблокировки экрана) и нажмите «Ввод».
Введите пароль разблокировки компьютера при появлении запроса
— Затем, когда будет предложено, нажмите «Ввод» еще раз, чтобы подтвердить
«Введите», чтобы одобрить установку доморощенного
— Подождите несколько минут, пока все не будет завершено. Это будет выглядеть следующим образом, и терминал вернется в состояние ожидания вашего ввода:
Так выглядит терминал после установки homebrew

(2b) Установить ffmpeg

После установки homebrew введите в терминале следующее:

brew install ffmpeg
Окно терминала с текстом установки ffmpeg


(3) Получил ffmpeg — давайте извлечем аудио
  1. Откройте терминал в определенной папке, где находятся ваши видеофайлы. Один простой способ сделать это:
    1. Введите (без Enter) cd  (обратите внимание на «пробел» после «cd»), а затем
    2. Перетащите из Finder папку с видеофайлами в Терминал
    3. Направьте терминал в папку, в которой находятся ваши видеофайлы

    4. Нажмите «Ввод»
    5. Теперь вы должны увидеть имя этого каталога в новой строке, на которой находится курсор терминала.
  2. В терминале скопируйте следующее и нажмите «Ввод»:

    echo "Создание каталога для речевых заметок только для вывода звука"
    mkdir -p речевые заметки для вывода только для звука
    echo "Успешное создание каталога речевых заметок-вывод-только-аудио"

    СЧЕТЧИК=0;
    echo "Поиск видеофайлов в директории"
    для ввода в *.avi *.mp4 *.mpeg *.mov; do
    # ffmpeg -i "$input" -vn -acodec copy "speechnotes-output-audio-only/$input"
    if [ -f "$input" ]; затем
    COUNTER=$((COUNTER + 1))
    echo "Найден и преобразован $input"
    ffmpeg -i "$input" -vn -acodec copy "speechnotes-output-audio-only/$input" -nostdin -loglevel panic
    fi
    done
    echo "Готово. Всего найдено $COUNTER видеофайлов в каталоге"

  3. Терминал после ввода вышеуказанного сценария

  4. Теперь вы должны были создать папку с именем «speechnotes-output-audio-only», в которой находятся только аудиофайлы. Поздравляю.
  5. Есть еще видеофайлы для конвертации в другой каталог? Просто повторите Got ffmpeg — давайте извлечем аудио для любого нужного вам каталога. Нет необходимости снова устанавливать brew или ffmpeg.

Свяжитесь с нами

Свяжитесь с нами по любым дополнительным вопросам по телефону    [email protected]

SpeechTexter | Печатайте голосом!

Общие проблемы на рабочем столе (ОС Windows, Mac, Linux)

Ошибка: «SpeechTexter не может получить доступ к вашему микрофону».

Пожалуйста, дайте разрешение на доступ к вашему микрофону.

Щелкните значок «замок» рядом с адресной строкой, найдите параметр «микрофон» и выберите «разрешить».

Ошибка: «Речь не обнаружена. Пожалуйста, попробуйте еще раз’.

Если вы получаете эту ошибку во время разговора, убедитесь, что ваш микрофон установлен в качестве записывающего устройства по умолчанию в вашем браузере [см. шаг 2].

Если вы используете гарнитуру, убедитесь, что переключатель отключения звука на шнуре выключен.

Ошибка: «Ошибка сети»

Плохое подключение к Интернету. Пожалуйста, повторите попытку позже.

Результат не будет передан в «редактор».

Достоверность результата недостаточно высока или присутствует фоновый шум. Накопление длинного текста в буфере также может привести к тому, что движок перестанет отвечать, пожалуйста, делайте паузы в речи.

Неверные результаты.

Пожалуйста, говорите громко и четко. Фоновый шум от вентиляторов, кондиционеров, холодильников и т. д. может значительно снизить точность. Попробуйте отключить их, если можете.

Могу ли я загрузить аудиофайл и получить транскрипцию?

Нет, эта функция недоступна.

Как расшифровать аудио (видео) файл на моем компьютере или из Интернета?

Воспроизведите файл в любом проигрывателе и нажмите кнопку «Старт» на веб-сайте SpeechTexter. Для лучших результатов выберите «Stereo Mix» в качестве записывающего устройства по умолчанию в вашем браузере, если вы обращаетесь к SpeechTexter и файлу с одного и того же устройства. [см. шаг 2]

Я не вижу параметр «Стерео микс» (ОС Windows)

Возможно, «Стерео микс» скрыт или не поддерживается вашей системой. Чтобы узнать это, перейдите в «Панель управления» → «Оборудование и звук» → «Звук» → вкладка «Запись». На панели щелкните правой кнопкой мыши пустую область и убедитесь, что установлены флажки «Просмотр отключенных устройств» и «Просмотр отключенных устройств». Если появится «Stereo Mix», вы можете включить его, щелкнув его правой кнопкой мыши и выбрав «включить». Если «Stereo Mix» не появился, это означает, что он не поддерживается вашей системой.

Как использовать список голосовых команд?

Список голосовых команд позволяет вам вставлять знаки препинания, какой-либо текст или запускать некоторые предустановленные функции (#newparagraph, #undo, #redo), используя только свой голос.

В первом столбце вы вводите свою голосовую команду. Во втором столбце вы вводите знак препинания или функцию.

Доступные функции:

#newparagraph (вставить новый абзац),

#undo (отменить последнее изменение),

#redo (повторить последнее изменение)

Чтобы использовать вышеуказанную функцию, сделайте паузу в своей речи, пока в вашей заметке не появится вся предыдущая продиктованная речь, затем скажите «вставить новый абзац» и дождитесь выполнения команды.

Можно ли предотвратить исчезновение моих пользовательских голосовых команд после закрытия браузера?

SpeechTexter по умолчанию сохраняет ваши данные в кеше вашего браузера. Если ваш браузер очистит кеш, ваши данные будут удалены.

Вы можете экспортировать свои пользовательские голосовые команды на свое устройство, а затем импортировать их, когда вам это нужно, нажав соответствующие кнопки над списком.

SpeechTexter использует формат JSON для хранения ваших голосовых команд.
Вы можете создать файл .txt в формате JSON на своем устройстве, а затем импортировать его в SpeechTexter.

Пример формата JSON показан ниже:


{

"точка": ".",

"точка": ".",

"знак вопроса": "?",

"новый абзац": "#newparagraph"

}

Я потерял продиктованную работу после закрытия браузера.

SpeechTexter не сохраняет диктуемый вами текст.
Пожалуйста, используйте опцию «автосохранение» или кнопку «скачать» (рекомендуется).
Опция «Автосохранение» попытается сохранить вашу работу в кеше вашего браузера.
Он будет оставаться там до тех пор, пока вы не отключите опцию «Автосохранение текста», не очистите кеш вручную или пока ваши браузеры не очистят кеш при выходе.

Распространенные проблемы в приложении для Android

Я получаю сообщение: «Распознавание речи недоступно».

Для работы SpeechTexter требуется «Приложение Google» из магазина Play. загрузить

Могу ли я использовать SpeechTexter для Android в автономном режиме?

Да, можно, но точность будет ниже.

Список доступных языковых пакетов для автономного использования (необходимо сначала загрузить): китайский, голландский, английский, французский, немецкий, индонезийский, итальянский, японский, корейский, португальский, русский, испанский.

Чтобы загрузить языковой пакет, откройте приложение «Google». Нажмите: «Еще» → «Настройки» → «Голос» → «Распознавание речи в автономном режиме» → «Все», а затем выберите язык, который хотите загрузить.

Распространенные проблемы в мобильном веб-приложении

Ошибка: «SpeechTexter не может получить доступ к вашему микрофону».

This entry was posted in Популярное