深度学习语音识别,基于tensorflow的语音识别程序。程序示例简单实用,便于理解
2022-03-20 21:31:20 22KB python; speech recognition
1
这是google最新推出的语言模型,是对《Attention is what you need》中的Transformer的升级版,它可以用在语言模型、对话系统等任务中。
2022-03-20 19:27:31 4.3MB 上下文建模 语言模型 语音识别 rescore
1
在我之前的项目中,我展示了如何使用Arduino开发板和BitVoicer服务器控制几个LED 。在这个项目中,我将使事情变得更加复杂。我还将使用Arduino DUE数模转换器(DAC)合成语音。如果您没有Arduino DUE,则可以使用其他Arduino板,但是您将需要一个外部DAC和一些其他代码来操作DAC(BVSSpeaker库将无法帮助您)。 在下面的视频中,您可以看到我还让Arduino播放了一首歌曲,并使LED闪烁,就像它们是钢琴键一样。对不起,我的钢琴技巧,但这是我能做到的最好的:)。LED实际上以与真实C,D和E键相同的顺序和时序闪烁,因此,如果您周围有钢琴,则可以跟随LED并播放同一首歌曲。这是一个不再存在的老零售商(Mappin)的叮当声。 将执行以下过程将语音命令转换为LED活动和合成语音: 1. Sparkfun Electret Breakout板将捕获并放大音频波; 2.放大后的信号将通过Arduino的模数转换器(ADC)进行数字化和缓冲; 3.音频样本将使用Arduino串行端口传输到BitVoicer服务器; 4. BitVoicer服务器将处理音频流并识别其包含的语音; 5.识别的语音将映射到预定义的命令,这些命令将发送回Arduino。如果其中一个命令用于合成语音,则BitVoicer Server将准备音频流并将其发送到Arduino; 6. Arduino将识别命令并执行适当的操作。如果接收到音频流,它将被排队到BVSSpeaker类中,并使用DUE DAC和DMA播放。 7. SparkFun单声道音频放大器会放大DAC信号,因此可以驱动8欧姆扬声器。 第一步是将Arduino和面包板与组件连接,如下图所示。我必须在扬声器下方放置一个小的橡胶垫,因为它会振动很多,而没有橡胶垫的话,音频质量会受到很大影响。 在这里,与我以前的项目相比,有一个小但重要的区别。大多数Arduino板均以5V运行,但DUE以3.3V运行。因为在3.3V下运行Sparkfun驻极体突破效果更好,所以如果您使用5V Arduino板,建议您在3.3V引脚和AREF引脚之间添加一个跳线。DUE已经使用了3.3V模拟基准,因此您不需要AREF引脚的跳线。实际上,DUE上的AREF引脚通过电阻桥连接到微控制器。要使用AREF引脚,必须从PCB上拆下电阻器BR1。
1
IBM Watson-QA-Speech Node.js应用程序(使用IBM Bluemix构建),该应用程序使用IBM Watson服务通过语音界面回答与健康相关的问题。 使用的服务: 演示: : 试一试! 单击下面的按钮以插入到IBM DevOps Services中,并在Bluemix上部署您自己的该应用程序副本。 浏览器要求 这需要HTML5音频标签和getUserMedia API。 如果您的浏览器不支持以下两种功能之一,则里程会有所不同。 大多数移动浏览器都存在这两个问题。 您可以在以下位置查看您的浏览器是否支持以下任一功能: 执照 此示例代码已在Apache 2.0下获得许可。 完整的许可证文本在可用。 贡献 请参阅。 开源@ IBM 在上找到更多开源项目 原始演示 这是为IBM QA服务组装的更新的演示。 原始演示可在以下网址获得: ibm-watson
2022-03-20 16:55:38 165KB JavaScript
1
房间混响生成模拟信号的经典论文,值得一读,论文中附带了源码,利用镜像生成原理,大家可以一看。This report gives a short overview of different methods that can be used for simulating room acoustics. The image method, which was proposed by Allen and Berkley in 1979, is probably one of the methods most commonly used in the acoustic signal processing
2022-03-18 13:40:07 518KB 语音识别 ieee论文
1
在终端设备上实现语音识别的TensorFlow预训练模型
2022-03-17 16:45:10 19.59MB Python开发-机器学习
1
在这里上传了TIMIT语音文件,原始的语音文件是sphfile编码的文件,虽然其后缀为.WAV文件,但是windows下是无法打开的,于是我在这里上传了将文件格式转换后的压缩包,希望可以帮助到大家。
2022-03-17 13:03:35 415.6MB 语料库 TIMIT 语音识别
1
静态库文件,可以直接使用,用法已经在压缩包中做了详细的说明。
2022-03-15 19:53:59 507KB QT 百度语音识别 win10
1
NULL 博文链接:https://passionke.iteye.com/blog/2248027
2022-03-14 23:34:55 690KB 源码 工具
1
HTML5录音并压缩改良版,并调用百度语音识别完成语音识别。
2022-03-14 23:27:15 59KB HTML5 语音识别
1