Speech2Text
在这里使用ffmpeg / flac / Google和ruby的功能是一个简单的界面,可以将语音转换为文本。
在本文的帮助下,使用来自Google的新的未记录语音API: /
我们能够在Ruby中提供一个非常简单的API,以将简单的音频解码为文本。
Google的API尚未公开,因此可能会更改。 它似乎也非常脆弱,因为它多次返回500,因此该库具有内置的重试代码-对于较大的音频文件,可能会在检索成功结果之前返回10多个失败…
似乎API也只喜欢较小的音频文件,因此有一个内置的分块器,使我们可以将音频分成较小的块。
安装
将此行添加到您的应用程序的Gemfile中:
gem 'speech2text'
然后执行:
$ bundle
或将其自己安装为:
$ gem install speech2text
您还必须在本地计算机上安装ffmpeg
2022-09-07 11:05:43
1.88MB
Ruby
1