Pytorch和Jupyter Notebook中的YoloV3 该存储库旨在在Pytorch和Jupyter Notebook中创建YoloV3检测器。 与其他现有的实现相比,我正在尝试采用一种“ oop”方法,后者通过在读取配置文件来迭代地构建体系结构。 该笔记本旨在用于学习和练习,许多想法和代码段摘自各种论文和博客。 我会尽量发表评论。 您应该只需按Shift键即可进入笔记本的末尾并查看结果。 要求 Python 3.6.4 火炬0.4.1 Jupyter笔记本电脑5.4.0 OpenCV 3.4.0 图片0.2.6 Pycocotools CUDA支持 使用说明 $ gi
2021-12-02 12:25:17 140.62MB deep-learning jupyter-notebook deep pytorch
1
神经网络:用Python语言从零开始实现的卷积神经网络,LSTM神经网络和神经网络
2021-12-02 11:10:51 349KB python deep-learning numpy jupyter-notebook
1
最新的深度学习中文版.pdf,个人收集电子书,仅用学习使用.
2021-12-02 10:48:48 26.49MB 深度学习
1
AI圣经!深度学习领域奠基性的经典畅销书!长期位居美国ya马逊AI和机器学习类图书榜首!所有数据科学家和机器学习从业者的bi读图书!特斯拉CEO埃隆·马斯克等国内外众多专家推荐!
2021-12-02 10:46:15 29.73MB 深度学习
1
用于任意形状的场景文本识别的AttentionOCR简介这是ICDAR2019基于任意张量流的场景文本点算法的排名第一在ICDAR2019任意形状文本(仅拉丁文,拉丁文和中文)上的稳健阅读挑战中基于No.1的基于张量流的场景文本发现算法,此外,该算法在ICDAR2019带有部分标签的大规模街景文本的稳健阅读挑战中也采用了该算法和ICDAR2019在招牌上阅读中文文本的强大阅读挑战。从T修改了场景文本检测算法
2021-12-02 10:15:02 34.57MB Python Deep Learning
1
再现AttnGAN的Pytorch实现在论文AttnGAN:带有注意生成的对抗网络的细粒度文本到图像生成中的AttnGAN再现AttnGAN的Pytorch实现在AttnGAN:带有注意生成性对抗网络的细粒度的文本到图像生成中的方法,张鹏川,黄秋元,张涵,Z哲,黄小雷,何小东。 (这项工作是在Tao担任Microsoft Research实习生时执行的)。 依赖项python 2.7 Pytorch此外,请将项目文件夹添加到PYTHONPATH并pip安装以下软件包:python-dateutil easydict pand
2021-12-01 19:50:44 35.95MB Python Deep Learning
1
用于目标检测的混淆矩阵 ConfusionMatrix类可用于为对象检测任务生成混淆矩阵。 用法 在测试代​​码中,您需要使用适当的参数声明ConfusionMatrix类。 conf_mat = ConfusionMatrix(num_classes = 3, CONF_THRESHOLD = 0.3, IOU_THRESHOLD = 0.5) 该类具有一个名为process_batch的函数,您可以使用它来更新混淆矩阵。 用法示例可以是: conf_mat.process_batch(preds, gt_boxes)其中preds是模型做出的预测,[N,6] x1,y1,x2,y2,置信度,类和gt_boxes是地面真相标签,[M,4] x1,y1,x2 ,y2,班级。 参考 该存储库使用Pytorch存储库中的函数 和 代码与下面的存储库非常相似,该存储库的主要贡献是Co
1
Coursera上的深度学习专业化(由deeplearning.ai提供) deeplearning.ai提供的Coursera所有课程的编程作业和测验。 授课老师: 笔记 有关Coursera深度学习专业中所有课程的详细面试准备笔记,请 设置 运行setup.sh以(i)下载经过预先​​训练的VGG-19数据集,并(ii)提取所有分配所需的经过z​​ip压缩的经过预先训练的模型和数据集。 学分 此仓库包含我针对该专业的工作。除非另有说明,否则代码库,测验问题和图表均取自的“ 。 编程作业 课程1:神经网络与深度学习 课程2:改善深度神经网络:超参数调整,正则化和优化 课程3:构建机器学习项目 此课程没有PA。但是本课程附带了非常有趣的案例研究测验(如下)。 课程4:卷积神经网络 课程5:序列模型 测验解决方案 课程1:神经网络与深度学习 第1周测验-深度学习简介: | 第2周测验-神经
1
当音乐遇上AI | | TF的官方实施文件:“样式条件音乐生成” ICME 2020(口头) 2020年3月18日发行。 描述 这是与音乐系(马来亚大学)合作的作品。 它对“变奏自动编码器”(VAE)的原始公式进行了改进,使用户可以调节由模型生成的音乐的创作风格。 在我们的实验中,我们在巴赫合唱(JSB)和西方民间音乐(NMD)上训练了我们的模型。 在生成时,用户可以指定模型来生成巴赫或民乐风格的音乐。 实验中使用的数据集可以从 , 和下载。 好奇我们的模型产生的音乐听起来如何? 随时访问并留下您的反馈。 依存关系 的Python 3.6.8 张量流(gpu)1.15.0 张量流概率0.8.0 漂亮的midi 0.2.8 在Ubuntu 16.04上测试。 运行代码 设置 检查数据集文件夹中的dataset.py ,并为MIDI文件放入正确的文件夹路径。 根据需要更改火车/
1
研究 发布基于飞轮的前沿研究工作,包括CV,NLP,KG,STDM等领域的顶会论文和比赛冠军模型。 目录 计算机视觉 任务类型 目录 简介 论文链接 图像检索 基于GNN的快速图像检索。 车流统计 AICITY2020车流统计竞赛数据集A TOP1方案。 -- 车辆再识别 给定目标车辆,在检索库中检索同id车辆,支持多种特征子网络。 -- 车辆异常检测 在监控视频中检测车辆异常情况,例如车辆碰撞,失速等。 -- 医学图像分析 任务:在AS-OCT图像的公共数据集上进行闭角类型分类和巩膜突点定位;相应模型:对应以上各任务的替代模型。 -- 光流估计 基于金字塔式处理,逐层学习细部光流,设计代价容量函数三原则的CNN模型,用于光流估计。 语义分割 针对多个数据集的图像语义分割模型的实现,包括Cityscapes,Pascal Context和ADE20K。 -- 轻量化检测 百度之星轻量化检测比赛评估工具。 -- 地标检索与识别 基于检索的地标检索与识别系统,支持地标型与非地标型识别,识别与检索结果相结合的多重识别结果投票和重新排序。 图像分类 模型利用重定义网络(URNet)
2021-11-30 18:47:39 85.49MB nlp data-mining computer-vision deep-learning
1