加斯尔
Google Chrome SODA离线语音识别命令行客户端
介绍:
这是概念证明,如何针对Chrome浏览器中的libsoda库编写代码,该库将其用于Live Transcribe。 它不是一个完整的应用程序,但是它将使用ALSA或SoX将通过stdin输入的音频的实时转录写出到stdout。 实时音频的SoX实际上不够实时,并且会导致大量有关管道滞后的警告消息。 ecasound获得了良好的结果。
准备:
通过启用实时字幕(Chrome 90或更高版本),从Chrome上为您的平台获取libsoda的副本。 然后,它应该在您的个人资料目录中的某个位置。 将共享库或DLL复制到repo目录。
编译:
make
或在Windows上:
make mingw
使用Google TTS :
从gtts repo目录中的libchrometts.so并运行以下命令:
2021-09-09 15:22:42
12KB
C
1