Как использовать распознавание речи Google Google без загрузки видео на YouTube?

У меня много лекционного видеоконтента, для которого я хотел бы иметь субтитры. YouTube автоматически создает субтитры для видео в определенных условиях (эти условия по-прежнему для меня несколько загадочны).

Я хотел бы иметь возможность использовать эту технологию распознавания речи вне YouTube. Я не хочу загружать каждое видео, чтобы получить транскрипт (слишком много времени), плюс, я не думаю, что YouTube сделает это для видео, которое длится более 30 минут (большинство из них), далее, я Не думайте, что это сделает это для непубличных видео (это проблема, потому что это премиальный контент, предназначенный для продажи).

  • Как продиктовать текст без текста на английском языке Windows 7?
  • Идеальный сценарий: есть программа, которую я могу запустить с моего рабочего стола, чтобы получить транскрипт из этих видеороликов, и он имеет равное или лучшее качество, чем YouTube, и имеет временные коды, похожие на SRT или XML, которые генерирует YouTube. [ Как Получить субтитры YouTube ].

    Допустимый сценарий. Есть несколько трюков, которые я могу сделать, чтобы заставить YouTube транскрибировать видео, независимо от того, установлены ли они на личном или публичном уровне, и, несмотря на длину.

    Сценарий сценария: есть библиотека или что-то, что я могу использовать для кодирования моей собственной программы. Я хорош с C # и хорошо с C ++ (но я действительно предпочитаю C #).

  • Невозможно воспроизвести ни видео IE10 HTML5, ни видео приложений с современным интерфейсом
  • Пакетное преобразование папки .mkv-файлов в файлы .m4v с использованием ffmpeg в MAC OS X
  • Как создать фильм из нескольких .bmp-файлов под Linux?
  • IPhone записывает видео, которые вращаются в системах Windows
  • В Google Chrome на Linux, где есть flv, если нет в / tmp?
  • Ffmpeg Audio Stereo to Mono с использованием только левого канала
  • One Solution collect form web for “Как использовать распознавание речи Google Google без загрузки видео на YouTube?”

    Google внедрил API веб-речи (как для распознавания речи, так и для синтеза) в Chrome, который вы можете использовать, если являетесь разработчиком. Это то, что YouTube использует для создания субтитров над некоторыми видео. Возможно, вы найдете код для взаимодействия с ним.

    Поток данных, вероятно, будет:

    Видеофайл => извлечь и преобразовать аудио => отправить его в Google API => получить текст => записать в SRT.

    EDIT: похоже, нет официальной страницы API, отличной от спецификации W3C. Так вот больше ссылок:

    Эти примеры касаются использования API из Chrome, но вы можете напрямую обратиться к онлайн-механизму распознавания речи Google. Например, Джаспер , личный помощник по распознаванию речи для Raspberrry Pi, позволяет вам выбрать Google в качестве механизма распознавания речи.

    Давайте будем гением компьютера.