Распознавание речи – MP3 для текстового программного обеспечения

Я ищу независимую от динамиков программу (коммерческую или бесплатную), которая позволит мне транскрибировать файлы MP3, содержащие речевые записи (особенно подкасты), в текст. Я хотел попробовать Dragon Naturally Speaking, но похоже, что он поддерживает только транскрипцию моих собственных речевых записей. Итак, каковы альтернативы?

Dragon Naturally Speaking будет импортировать mp3-файлы и попытаться их расшифровать. Он предпочитает настраивать свое распознавание голоса на отдельного оратора, но делает справедливую работу без настройки. Это, вероятно, будет работать лучше всего, если ваши динамики подкастов будут похожи на Тома Брокау.

Одним из возможных решений было бы загрузить ваше видео на Youtube и попробовать автоматические титры, которые вы можете включить … он еще не слишком точен, но вы можете загрузить файл подписи и отредактировать его самостоятельно, если это поможет … как Для вопросов авторского права / пиратства для песни вы можете сделать видео приватным в своем профиле, если это возможно?

Я бы предостерег от попытки использования Dragon Naturally Speaking. Я написал несколько сценариев на моем jailbroken iphone, чтобы скопировать / преобразовать все файлы голосовой почты с моего телефона в папку на моем ПК и запустить с ними службу транскрипции Dragon Naturally Speaking.

Результат выполнения транскрипции с файлами с разными динамиками был абсолютно непригодным. Я пробовал некоторые из альтернатив с открытым исходным кодом, но независимое от голоса распознавание голоса по-прежнему кажется ограниченным очень маленькими словарями.

Я использую http://www.voicebase.com с подкастом и видео на английском языке, и он работает очень хорошо. Это бесплатно для 50 аудио часов.

Вы можете скачать аудио транскрипцию на rtf, srt или pdf.

Вы можете загружать транскрипции машины примерно через 10-15 минут после загрузки, а иногда и раньше.

Открытый исходный код: CMU Sphinx

Shareware: http://www.e-speaking.com/ (Windows)

Коммерческая: Dragon NaturallySpeaking (Windows)

Вы также можете попробовать этот метод, если вы пытаетесь использовать osx, который можно сделать с помощью смелости и звукового сигнала

Вы также можете найти некоторые релевантные ссылки для openource, еще один shareware, который стоит попробовать: voxcribecc

Если вы программист .net, вы можете использовать этот метод для создания собственного набора

Podzinger будет отличным решением, но я не уверен, что рампа (новое название для компании, которая раньше была EveryZing, которая продюсировала Podzinger) предлагает услугу бесплатно больше …

http://en.wikipedia.org/wiki/Podzinger

Давайте будем гением компьютера.