擅长智能优化算法、神经网络预测、信号处理、元胞自动机、图像处理、路径规划、无人机等多种领域的Matlab仿真。
2022-12-26 12:25:23 512KB matlab
1
面表情 可以模仿您表情的语音聊天机器人。 这是一个Unity项目(仅适用于Android),其中包含两个模块。 其中之一是FaceTracking ,它使用和检测面部表情,将其转换为模型并gif。 另一个是AI (聊天机器人) ,它使用 , 和进行语音聊天。 English | 发布 建立 从或下载shape_predictor_68_face_landmarks.dat (面部地标检测器)和Facemoji_Plugins_Assets_1.5.0.unitypackage (简化的OpenCV,Dlib,Live2D和Iflytek Assets库)。 git clone htt
2022-12-25 21:54:09 23.74MB emoji opencv ai unity
1
matlab录入语音信号代码 作者 标题 丹尼尔·莫雷诺·曼萨诺(Daniel Moreno Manzano) 音高估计和发声检测 在本文中,我将解释两种不同方法的发展,以便在语音音频中找到音高,首先区分有声和无声部分。 这些算法将在MATLAB:copyright:中开发。 首先,将对数据进行分析,以便在音频文件数据库中找到要使用的重要参数,并希望了解如何以人的声音音高工作。 在每种方法中,将提出对该思想的简要解释。 此外,还将解释重要的代码部分并公开一些结果。 介绍 两种算法以及分析中处理数据的方式都相同。 音频文件将在32 ms的窗口中进行评估,这是检测仅在浊音部分而不是清音部分的音调的最佳方法。 使用fda_ue数据库(测试数据库)时,窗口将以15 ms的周期移动;使用ptdb_tug数据库( train数据库)时,窗口将以10 ms的周期ptdb_tug 。 我选择的信号处理方法是: 自相关 零交叉+倒谱 要求:在本项目中,将其视为实验是很重要的,以便了解音高处理和估算。 数据 可以通过下一个Google云端硬盘链接获取所使用的数据: 为了在不更改代码的情况下工作,预定义的目录方案是 . ├──
2022-12-25 17:52:13 287KB 系统开源
1
基于MATLAB的语音信号录制采集和分析的课程设计
2022-12-23 17:40:27 70KB MATLAB 语音信号 randn 高斯随机噪音
1
免费语音合成软件Panopreter基础版中文版能够使用自然流利的声音朗读电脑上的文件和用户输入的字、词、短语、段落和文章,并可以把文字内容转换保存为wav和mp3格式的音频文件。支持多个文件批量转换为语音文件,可以高亮显示正在被读的词或句子。用户能够调节朗读的快慢和音量大小,支持中文、英语、法语、德语、西班牙语、俄语、日语等数十种语言朗读。 ps:该软件使得电脑用户不必再长时间地看着电脑屏幕,预防近视,保护视力,老中少用户皆宜。另外在语言学习方面,在语言的听、说能力练习上,也是非常有帮助的
1
此次更新在原有版本上传再次升级,修复部分逻辑以及bug 修复bug:店员拒单后,退款会退到店员账号里而不是用户账户里。 修复bug:客户在盲盒下单后,马上取消了订单,但是店员还是可以抢单(虽然点开模板消息右上角显示了已取消,但是依然可以接到单),会造成店员不知情用户取单,还是会去加客户微信。 优化部分逻辑,此版本已趋于完美,毕竟是商业版。 同时增加一些常见的搭建问题解决方案
2022-12-22 18:22:49 256.33MB 源码
载一段音频信号,或录制一段各人自己的语音信号作为分析的对象,利用 Matlab 中的随机函数产生噪声加入到语音信号中,模仿语音信号被污染,并对原信号和含噪声的信号进行频谱分析。比较不同类型滤波器的性能,选择一种合适的数字滤波器的设计方法,对被噪声污染的信号进行滤波,分析滤波后信号的时域和频域特征,回放音频信号,分别绘制原信号、含噪声信号和滤波后信号的时域波形图和频谱图以及滤波器的频响特性曲线。
2022-12-22 12:35:40 839KB matlab 语音识别 开发语言
1
智能语音识别芯片LD3320资料(技术开发手册)。 1、包括PDF格式文档:LD3320数据手册。 2、包括PDF格式文档:LD3320开发手册。 3、包括PDF格式文档:LD3320并行串行读写辅助说明。 4、以上文档中含智能语音识别芯片LD3320的开发参考程序代码和参考电路图。 5、LD3320是一款语音识别芯片,一般用于人工智能的自动语音识别场合。
2022-12-21 16:28:34 1.57MB LD3320 人工智能 语音识别 技术开发手册
1
本源程序代码的目的是给出语音情感计算的概况以及最新进展,探讨语音情感计算的整个过程。首先,介绍了语音情感计算的定义以及它的交叉学科的本质。接下来,从数字信号处理的角度研究了基于最常用的数字语音信号特征——MFCC的语音情感检测的全过程。然后,利用柏林语音情感数据库分析了在提取MFCC的过程中一些具体的参数的选择对检测结果准确率的影响。最后,阐述了语音情感计算领域面临的挑战以及今后的可能发展趋势。 用的是柏林语音情感数据库,最终的识别率勉强接近50%,存在的问题我也思考了,但是一时解决不了。
2022-12-21 13:42:55 20KB 语音情感识别
1
提取均值信号特征的matlab代码两个扬声器的基于 LSTM/BLSTM 的 PIT 在多通话者混合语音分离和识别方面取得的进展,通常被称为“鸡尾酒会问题”,并没有那么令人印象深刻。 尽管人类听众可以很容易地感知混合声音中的不同来源,但对于计算机来说,同样的任务似乎极其困难,尤其是当只有一个麦克风记录混合语音时。 1. 运行性能 注意:训练集和验证集包含通过从 WSJ0 集中随机选择说话者和话语生成的两个说话者混合,并以 -2.5 dB 和 2.5 dB 之间统一选择的各种信噪比 (SNR) 混合它们. 对于LSTM ,不同性别的混合音频结果如下: 对于BLSTM ,不同性别的混合音频结果如下: 从上面的结果可以看出,混合性别音频的分离效果优于同性音频,BLSTM 的性能优于 LSTM。 2. 评价标准 SDR:信号失真比 SAR:信号与伪像的比率 SIR:信号干扰比 STOI:短期客观可懂度测量 ESTOI:扩展的短期目标可懂度测量 PESQ:语音质量的感知评估 3. 依赖库 matlab(我的测试版:R2016b 64位) tensorflow(我的测试版本:1.4.0) anac
2022-12-21 11:33:49 5.37MB 系统开源
1