API речевой речи Google

Теперь я работаю с моим проектом, и я собираюсь создать приложение, подобное Siri, для настольного компьютера. Я думаю, что если Google Speech API является надежным и точным для распознавания речи? Можете ли вы предложить мне, какой язык речи является наиболее точным с точки зрения распознавания речи? Наиболее предпочтительно свободный API. Спасибо.

Хотя API-интерфейс Google является бесплатным, он не является официальным публичным API. Некоторые люди имеют обратную инженерию, как это обсуждается в этом блоге . Если вы планируете напрямую обращаться к API напрямую для коммерческого продукта, я бы не рекомендовал его, потому что он может отказаться от него или изменить его без предупреждения, взломав ваш продукт. Это недавно произошло с разработчиками, которые использовали Google Weather API . С другой стороны, если вы пользуетесь браузером Chrome с помощью x-webkit-speech, вы, вероятно, безопасны, так как он поддерживается Google. Распознавание речи Google прямо там с множеством более популярных коммерческих решений. Они имеют большой опыт работы с ним в других проектах, таких как Google Voice и ныне несуществующий Google 411. У них есть некоторые из ведущих ученых-речей, работающих на них. Единственная свободная альтернатива, о которой я могу думать, это Sphinx, которая является проектом с открытым исходным кодом из Университета Карнеги-Меллона. Крутая кривая обучения с использованием этого решения, и если вы хотите, чтобы она была настроена как услуга, вам придется ее самостоятельно развивать. Нюанс – другой крупный игрок на рынке распознавания речи (я считаю, что это то, что использует Сири), и у них есть решения, которые предлагают распознавание речи как услугу. Но они дорогие.

Обновление ответа на комментарии по языковой поддержке

Windows Speech Recognition поддерживает другие языки, как и большинство систем распознавания речи. Но оговорка в том, что вы должны сказать системе, какой язык использовать, и она должна поддерживать соответствующий язык. У каждого поставщика есть список поддерживаемых им языков, и они специфичны для региона. Например, продавец может поддерживать испанский, испанский и испанский испанский испанский, испанский и испанский; которые имеют несколько разные диалекты. Но механизм распознавания речи может поддерживать только один язык / диалект по таймеру на пользователя. Пользователь не может говорить на нескольких языках в системе распознавания речи, не обращаясь сначала к нему на этот язык.

Обновлено 3/17/2014

Поле ввода x-webkit-речи устарело из-за отсутствия поддержки в других браузерах. Это будет заменено API-интерфейсом Web Speech , который представляет собой javascript API. Вы можете найти пример, как использовать его здесь .

Interesting Posts
Давайте будем гением компьютера.