本程序在vs2013下完美运行,如果编译不通过,请先下载Microsoft Speech SDK,并设置好对应选项,程序分为两部分,分为语音转文字和文字转语音
2022-03-22 15:07:58 4KB 语音识别
1
为了减小语音帧的截断效应,需要加窗处理: 矩形窗: Hamming: Hann: 矩形窗的主瓣宽度最小,旁瓣高度最高,会导致泄漏现象,汉明窗的主瓣最宽,旁瓣高度最低,可以有效的克服泄漏现象,具有更平滑的低通特性,应用更广泛。 预处理及特征参数提取
2022-03-21 11:37:40 1.05MB 语音识别
1
基于语音识别与GSM的智能家居控制系统,语音识别芯片LD3320模块资料
2022-03-21 09:55:16 449KB 语音识别
1
本文以SPCE061A单片机作为核心控制器,设计了一种基于语音识别技术的语音控制智能手系统。系统由微控制器、语音模块、电机模块、光电寻迹模块、无线控制模块等部分组成。控制器利用语音模块识别出操作人员的语音命令后,通过电机模块与光电寻迹模块的协同工作来完成预设的多个复杂动作。
2022-03-21 09:40:59 97KB SPCE061A 智能手 语音识别 语音控制
1
深度学习语音识别,基于tensorflow的语音识别程序。程序示例简单实用,便于理解
2022-03-20 21:31:20 22KB python; speech recognition
1
这是google最新推出的语言模型,是对《Attention is what you need》中的Transformer的升级版,它可以用在语言模型、对话系统等任务中。
2022-03-20 19:27:31 4.3MB 上下文建模 语言模型 语音识别 rescore
1
在我之前的项目中,我展示了如何使用Arduino开发板和BitVoicer服务器控制几个LED 。在这个项目中,我将使事情变得更加复杂。我还将使用Arduino DUE数模转换器(DAC)合成语音。如果您没有Arduino DUE,则可以使用其他Arduino板,但是您将需要一个外部DAC和一些其他代码来操作DAC(BVSSpeaker库将无法帮助您)。 在下面的视频中,您可以看到我还让Arduino播放了一首歌曲,并使LED闪烁,就像它们是钢琴键一样。对不起,我的钢琴技巧,但这是我能做到的最好的:)。LED实际上以与真实C,D和E键相同的顺序和时序闪烁,因此,如果您周围有钢琴,则可以跟随LED并播放同一首歌曲。这是一个不再存在的老零售商(Mappin)的叮当声。 将执行以下过程将语音命令转换为LED活动和合成语音: 1. Sparkfun Electret Breakout板将捕获并放大音频波; 2.放大后的信号将通过Arduino的模数转换器(ADC)进行数字化和缓冲; 3.音频样本将使用Arduino串行端口传输到BitVoicer服务器; 4. BitVoicer服务器将处理音频流并识别其包含的语音; 5.识别的语音将映射到预定义的命令,这些命令将发送回Arduino。如果其中一个命令用于合成语音,则BitVoicer Server将准备音频流并将其发送到Arduino; 6. Arduino将识别命令并执行适当的操作。如果接收到音频流,它将被排队到BVSSpeaker类中,并使用DUE DAC和DMA播放。 7. SparkFun单声道音频放大器会放大DAC信号,因此可以驱动8欧姆扬声器。 第一步是将Arduino和面包板与组件连接,如下图所示。我必须在扬声器下方放置一个小的橡胶垫,因为它会振动很多,而没有橡胶垫的话,音频质量会受到很大影响。 在这里,与我以前的项目相比,有一个小但重要的区别。大多数Arduino板均以5V运行,但DUE以3.3V运行。因为在3.3V下运行Sparkfun驻极体突破效果更好,所以如果您使用5V Arduino板,建议您在3.3V引脚和AREF引脚之间添加一个跳线。DUE已经使用了3.3V模拟基准,因此您不需要AREF引脚的跳线。实际上,DUE上的AREF引脚通过电阻桥连接到微控制器。要使用AREF引脚,必须从PCB上拆下电阻器BR1。
1
IBM Watson-QA-Speech Node.js应用程序(使用IBM Bluemix构建),该应用程序使用IBM Watson服务通过语音界面回答与健康相关的问题。 使用的服务: 演示: : 试一试! 单击下面的按钮以插入到IBM DevOps Services中,并在Bluemix上部署您自己的该应用程序副本。 浏览器要求 这需要HTML5音频标签和getUserMedia API。 如果您的浏览器不支持以下两种功能之一,则里程会有所不同。 大多数移动浏览器都存在这两个问题。 您可以在以下位置查看您的浏览器是否支持以下任一功能: 执照 此示例代码已在Apache 2.0下获得许可。 完整的许可证文本在可用。 贡献 请参阅。 开源@ IBM 在上找到更多开源项目 原始演示 这是为IBM QA服务组装的更新的演示。 原始演示可在以下网址获得: ibm-watson
2022-03-20 16:55:38 165KB JavaScript
1
房间混响生成模拟信号的经典论文,值得一读,论文中附带了源码,利用镜像生成原理,大家可以一看。This report gives a short overview of different methods that can be used for simulating room acoustics. The image method, which was proposed by Allen and Berkley in 1979, is probably one of the methods most commonly used in the acoustic signal processing
2022-03-18 13:40:07 518KB 语音识别 ieee论文
1
在终端设备上实现语音识别的TensorFlow预训练模型
2022-03-17 16:45:10 19.59MB Python开发-机器学习
1