MevonAI-语音情感识别 识别音频段中多个发言人的情绪· 在这里尝试演示 目录 说话人二值化 特征提取 CNN模型 训练模型 贡献 执照 致谢 常问问题 关于该项目 该项目的主要目的是识别呼叫音频中多个说话者的情绪,作为呼叫中心客户满意度反馈的应用程序。 建于 的Python 3.6.9 Tensorflow-Keras 解放军 入门 按照以下说明在本地计算机上设置项目。 安装 创建一个python虚拟环境 sudo apt install python3-venv mkdir mevonAI cd mevonAI python3 -m venv mevon-env source mevon-env/bin/activate 克隆仓库 git clone https://github.com/SuyashMore/MevonAI-Speech-Emotion-Recog
1
使用 3D 多分辨率 R-CNN 的脑微出血 3D 实例分割框架 由 I-Chun Arthur Liu、Chien-Yao Wang、Jiun-Wei Chen、Wei-Chi Li、Feng-Chi Chang 撰写的论文“3D Instance Segmentation Framework for Cerebral Microbleeds using 3D Multi-Resolution R-CNN”的官方 PyTorch 实现Yi-Chung Lee, Yi-Chu Liao, Chih-Ping Chung, Hong-Yuan Mark Liao, Li-Fen Chen. 论文目前正在审查中。 关键词:3D 实例分割、3D 对象检测、脑微出血、卷积神经网络 (CNN)、磁敏感加权成像 (SWI)、3D Mask R-CNN、磁共振成像 (MRI)、医学成像、pytorch
1
qtrader 资产组合管理的强化学习 为什么要进行强化学习? 学习最佳行动,而不是为市场建模。 由于其在线培训,因此可以适应市场的暂时变化。 优化长期(累积)回报,而不是瞬时收益。 设置 由于typing s,因此与Python 3兼容 苹果系统 source scripts/setup.sh 文献资料 : qtrader简介 :现有方法的动机,利弊 :相关资源清单 :硕士论文 :15分钟的项目演讲
1
Google的deepmind团队发表在nature上有关alphago的论文,包含原有的英文版,我翻译的中文版,以及一个20分钟对alphago工作原理的讲述。
2022-03-01 08:28:24 31.32MB deepmind alphago
1
Supervised Sequence Labelling with Recurrent Neural Networks,Supervised Sequence Labelling with Recurrent Neural Networks,Supervised Sequence Labelling with Recurrent Neural Networks,
2022-02-25 21:12:03 2.89MB Recurrent Neural Networks deep
1
高效且可扩展的物理信息深度学习 搭配为主PINN求解器和PDE发现方法之上分布式计算多工人。 如果需要,请使用TensorDiffEq: 一个无网格的PINN求解器,可以分布在多个工作程序(GPU)上以解决正向问题(推理)和逆向问题(发现) 可扩展域-迭代求解器构造允许ND时空支持包括对不带时间元素的ND空间域的支持 正向和反向PINN的自适应配置方法 直观的用户界面,可对变量域,边界条件,初始条件和强格式PDE进行明确定义 是什么让TensorDiffEq与众不同? 完全开源 求解可解决正向和反向问题,从而提高了解决方案的准确性和培训的稳定性,从而减少了总体培训时间 适用于大型或细粒度时空域的多GPU分布式训练 建立在Tensorflow 2.0之上,以增加对最新TF版本独有的新功能的支持,例如,有效图形构建的以及图形优化的*-源代码不可能再被淘汰Tensorflow版本发行 直
2022-02-25 16:59:54 817KB tensorflow gpu neural-networks gpu-acceleration
1
Neural Networks and Deep Learning 中文版 Michael Nielsen 著 完整书签 很好的入门神经网络和深度学习的书籍!
2022-02-22 13:29:51 3.77MB 深度学习 神经网络
1
人脸识别[Wavelet and Neural Networks] V2:基于小波和神经网络的简单有效的人脸识别源代码。 该代码已通过AT&T数据库进行测试,达到了97.90%的出色识别率(每个类别40个类别,5个训练图像和5个测试图像,因此总共随机选择了200个训练图像和200个测试图像,并且两者之间没有重叠训练和测试图像)。 查看更多:http://matlab-recognition-code.com/face-recognition-based-on-wavelet-and-neural-networks-matlab-code/
2022-02-19 16:05:36 7.73MB 开源软件
1
使用神经网络和其他分类器进行环境声音分类ESC 使用音频数据集进行音频特征提取和分类 包含ECS-10音频数据。 它包含10类不同的环境声音(海浪,孩子们玩耍等) 主要目标是比较6个经过测试的分类器的分类准确性。 依存关系 带有Python 2.7的Anaconda 2。 (尚未测试Python 3.6) Librosa(音频加载,音频可视化和特征提取) 科学工具学习 Keras(Theano后端) Numpy,Matplotlib 熊猫(数据可视化) Jupyter笔记本 添加了Jupyter Notebook(Python 2.7内核)以说明工作流程。 用于特征提取和分类的脚本已作为.py文件添加,并随后全部加载到Jupyter Notebook中。 运行feature_extraction.py label.npy创建一个numpy数组( feature.npy ),
2022-02-13 09:14:39 39.76MB JupyterNotebook
1
CNNIQAplusplus 以下论文的PyTorch 1.3实施: 笔记 在这里,选择优化器作为Adam,而不是本文中带有势头的SGD。 训练 CUDA_VISIBLE_DEVICES=0 python main.py --exp_id=0 --database=LIVE --model=CNNIQAplusplus 训练前, im_dir在config.yaml被指定必须的。 可视化 tensorboard --logdir=tensorboard_logs --port=6006 # in the server (host:port) ssh -p port -L 6006:localhost:6006 user@host # in your PC. See the visualization in your PC 要求 conda create -n reproducib
1