口语数字识别 :studio_microphone: LSTM语音数字识别 内容 概述 语音数字识别是一个隔离的单词识别系统,可转录0-9之间的各个语音号码。 数据集 使用免费语音数字数据集(FSDD)来训练该模型,该模型具有来自3位讲英语且带有重音的扬声器的1,500张录音。 该模型接受了1,470张唱片的训练,并在30张唱片上进行了测试。 模型与训练 该模型包括: LSTM层 全连接层 损失函数:分类交叉熵 优化算法:亚当 模型在300个时代进行了训练。 改进和要添加的功能 数据集需要更多不同类型的发言人,包括不同性别和不同口音的人,以便该系统在世界范围内正常运行 模型本身可以改进 使用更好的培训/测试策略 具有使用自己的声音来测试模型的界面,使前端易于与模型进行交互 改善模型性能 基本上,这是我的实验,旨在了解如何构建仅检测语音数字的语音识别系统。 用法 python spoke_digit.py为了运行
1
从面部表情实时情感分析 从面部表情实时进行人类情绪分析。 它使用了深度的卷积神经网络。 使用的模型在测试数据上的准确性达到63%。 实时分析器为当前情绪分配合适的表情符号。 模型实现是在keras中完成的。 一些预测的输出: 使用的表情符号: 实时情绪分析器快照 从图中可以明显看出,给定帧的模型预测是中性的。 模型架构 文件清单 facial Emotions.ipynb :Jupyter笔记本,具有记录完整的代码,从开始到培训都说明模型准备。 可用于重新训练模型。 main.py :主python webcam_utils :用于从面部实时检测情绪的代码prediction_utils :
1
显着性方法 介绍 该存储库包含以下显着性技术的代码: XRAI *(,) SmoothGrad *() 香草渐变( ,) 引导反向传播() 综合渐变() 咬合 Grad-CAM() 模糊IG *由PAIR开发。 此列表绝不是全面的。 我们正在接受请求添加新方法的请求! 下载 pip install saliency 或开发版本: git clone https://github.com/pair-code/saliency cd saliency 用法 每个显着性掩码类都从SaliencyMask基类扩展。 此类包含以下方法: __init__(graph, sessio
1
TheWebConf是中国计算机学会(CCF)推荐的A类国际学术会议,由国际万维网会议委员会(IW3C2)和主办地地方团队合作组织,每年召开一次,今年是第31届会议。本年度论文录用率为17.7%,TheWebConf即将召开,来自弗吉亚理工和亚马逊等学者的《双曲神经网络》教程,值得关注!
2022-04-29 10:05:39 8.33MB 神经网络 人工智能 深度学习 机器学习
(3rd Edition) Simon O. Haykin-Neural Networks and Learning Machines-Prentice Hall (2008).pdf
2022-04-28 16:11:09 13.71MB Neural Networks Learning Machines
1
MobileNet V2的PyTorch实施 + Release of next generation of MobileNet in my repo *mobilenetv3.pytorch* + Release of advanced design of MobileNetV2 in my repo *HBONet* [ICCV 2019] + Release of better pre-trained model. See below for details. 如Mark Sandler,Andrew Howard,Menglong Zhu,Andrey Zhmoginov和Liang-Chieh Chen所讲的,使用框架对ILSVRC2012基准进行了。 此实现提供了一个示例过程,用于训练和验证任何流行的深度神经网络体系结构,并集成了模块化数据处理,训练,日志记录和可视化。
1
这是基于Deepmat( )的CDL改编而成的用于链接预测(MAP)的关系深度学习(RDL)。 请转到example / README,以获取有关运行代码的更多说明。 要安装代码,请参阅类似的CDL流程。 参考: @inproceedings{DBLP:conf/aaai/WSY17, author = {Hao Wang and Xingjian Shi and Dit{-}Yan Yeung}, title = {Relational Deep Learning: {A} Deep Latent Variable Model for Link Prediction}, booktitle = {AAAI}, pages = {2688--2694},
1
本文是在自然语言处理上应用比较好的深度网络RNN,包含RNN的入门讲解、代码实现
2022-04-26 15:31:08 1.08MB RNN 深度学习 NLP 自然语言处理
1
纯英语名著,关于大脑理论结合人工智能的神经网络和深度学习相关定理的百科全书。本书据我所知没有译本,不过值得一看。
2022-04-18 21:05:40 33.62MB 神经网络 人工智能 深度学习 机器学习
1
CNN-On-The-Cloud- 用于为Fashion MNIST数据集构建图像分类器的代码。 使用Keras库构建并在FloydHub云平台上接受培训。 您可以在签出相应的“中型”文章 您可以通过单击下面的按钮快速获得此代码并在云上运行。
2022-04-18 18:24:57 24KB tutorial deep-learning floydhub neural-networks
1