语音情感识别 介绍 该存储库负责构建和培训语音情感识别系统。 该工具背后的基本思想是构建和训练/测试合适的机器学习(以及深度学习)算法,该算法可以识别和检测语音中的人类情感。 这对于许多行业领域很有用,例如提出产品推荐,情感计算等。 查看本以获取更多信息。 要求 Python 3.6+ Python包 librosa == 0.6.3 麻木 大熊猫 声音文件== 0.9.0 海浪 斯克莱恩 tqdm == 4.28.1 matplotlib == 2.2.3 pyaudio == 0.2.11 (可选) :如果要通过转换为16000Hz采样率和convert_wavs.py提供的单声道来添加更多采样音频,则使用 通过以下命令安装这些库: pip3 install -r requirements.txt 数据集 该存储库使用了4个数据集(包括此仓库的自定义数据集),这些数
2021-11-10 18:16:18 911.73MB machine-learning deep-learning sklearn keras
1
image_and_speech_processing Face and speech recognition by use pyqt5 face_recognition baiduai 使用pyqt5 face_recognition 百度ai实现的 对图像和语音的处理 这是上一个版本的更新版 。 这是上一个版本 下面是部分效果图 界面是使用pyqt5 做的 教程稍后会在博客上发布 人脸识别是用face_recognition 这是一些使用方法 语音合成 语音识别是使用百度AI提供的api接口实现 教程稍后再博客上发布 主要思路 稍后再博客上发布
2021-11-10 09:50:20 13.99MB Python
1
图像的均方误差的matlab代码脊柱X射线图像上的曲率识别 执照 作者:Yann Bachelot,Maxime Carlier,Dimitri Mikec,Luka Matsuda,Jiri Ruzicka。 由Noelie Debs和Carole Frindel监督。 该代码是开源的,这意味着任何人都可以从Github存储库中查看和下载我们的代码。 此处执行的代码是INSA Lyon工学院(生物信息学和建模专业)图像分析课程最终项目的一部分。 项目目标 该项目的目的是通过提供可自动识别色谱柱的计算机例程,通过分析X射线轮廓图像来帮助进行外科手术计划。 执行 我们的代码遵循以下步骤:对比图像,过滤,检测脊柱的起点和终点,检测关键点,选择感兴趣的点,拟合曲线,计算一些统计量。 输入:以个人资料(JPEG格式,EOS采集系统)的形式对30位患者的30幅X射线图像进行数据集。 X射线看起来像传统的X射线照相:其对比度取决于所遍历结构的衰减系数。 输出:在每幅图像上还绘制了30张相同的图像,包括关键点和适合脊椎的相关曲线。 3个包含所有图像的文件夹,对应3种不同的检测方法:霍夫变换,哈里斯检
2021-11-09 21:28:50 67.1MB 系统开源
1
使用Tensorflow进行临床实体识别 此仓库使用Tensorflow实现了CER模型(字符嵌入+单词嵌入+ BLSTM + CRF)。 合奏训练后的最新表现(测试集上的F1分数在84到85之间)。 有关更多详细信息,请检查。 使用预先训练的模型 使用TensorFlow可以轻松加载预训练图。 预训练的模型在exp dir中。 将集成训练模型与 # pretrained ensemble of models models= " exp/adam.cap-2.char-100-100.word-300-300.lstm-1.p-0 exp/rmsprop.char-100-100.plstm-2 exp/rmsprop.cap-5.char-100-100.word-300-300.sru-1 exp/rmsprop.cap-5.char-100-300.word-300-300.l
2021-11-09 16:34:24 12.45MB Python
1
使用自我注意从可穿戴传感器数据中识别人类活动 Tensorflow 2.x实施“使用自注意力从可穿戴传感器数据中识别人类活动”, ,作者: 和M. Tanjid Hasan Tonmoy等。 [ ] [ ] **此存储库正在维护中。 最终版本的代码将很快发布** 安装 要在python3环境中安装依赖项,请运行: pip install -r requirements.txt 数据集下载 要下载数据集并将其放置在data目录下以进行模型训练和推理, dataset_download.py使用以下命令运行脚本dataset_download.py : python dataset_download.py --dataset DATASET --unzip 此处,此项目的命令行参数DATASET中的数据集名称如下: DATASET = pamap2 / opp / uschad
1
人类活动识别 在 UCI HAR 数据集上使用 ML 进行人类活动识别
2021-11-08 15:56:17 55KB Python
1
使用深度神经网络的离线数学公式识别 基于。 要求 的Python 3 可以使用PIP安装所有依赖项。 pip install -r requirements.txt 如果您想在PyTorch中使用其他安装方法或其他CUDA版本(例如CUDA 10),请按照的说明进行。 数据 。 因为它是一个在线手写数据集,所以它由InkML文件组成,但是此体系结构用于离线识别,这意味着将图像用作输入。 数据集已转换为大小为256x256图像,并且还提取了地面真实情况。 转换后的数据集可以在。 数据需要在data/目录中,并且tokens.tsv文件定义了可用制表符,这些制表符由制表符分隔。 训练和验证集在gt_split/train.tsv和gt_split/validation.tsv中定义,其中每行是图像及其基本事实的路径。 可以通过运行以下命令来生成训练/验证拆分: python dat
2021-11-08 10:09:30 11.59MB JupyterNotebook
1
Traffic_sign_recognition:使用定向梯度直方图(HOG)和基于色域的功能识别交通标志。 支持向量机(SVM)用于对图像进行分类
1
Python人脸识别第三方库face_recognition接口简单说明,及简单使用方法
2021-11-06 14:41:40 38KB Python人脸识别 face_recognition
1
密集连接的时延神经网络 在我们的论文 的密集 (INTERSPEECH 2020)中,密集连接的时延神经网络(D-TDNN)的PyTorch实施。 什么是新的 :warning: [2021-02-14]我们在添加了一个impl选项,现在您可以选择: 'conv':通过F.conv1d实现TDNN。 'linear':通过F.unfold和F.linear实现TDNN。 检查此以获取更多信息。 请注意,尚未完成“ conv”的预训练模型。 [2021-02-04]此存储库中的TDNN(默认实现)比nn.Conv1d慢,但我们采用它是因为: 此仓库中的TDNN还用于创建nn.Conv1d(非对称填充)不完全支持的F-TDNN模型。 nn.Conv1d(dilation> 1,bias = True)训练缓慢。 但是,这里我们不使用F-TDNN,我们总是在D-TDNN中设置bias = F
1