压缩AI CompressAI( compress-ay )是用于端到端压缩研究的PyTorch库和评估平台。 CompressAI当前提供: 用于基于深度学习的数据压缩的自定义操作,层和模型 官方库的部分端口 预训练的端到端压缩模型,用于学习图像压缩 评估脚本,将学习的模型与经典图像/视频压缩编解码器进行比较 注意:多GPU支持目前处于试验阶段。 安装 CompressAI仅支持python 3.6+(当前对PyTorch的支持<3.9)和PyTorch 1.4+。还需要C ++ 17编译器,最新版本的pip(19.0+)和常见的python软件包(有关完整列表,请参见setup.py )。 要开始并安装CompressAI,请在运行以下命令: git clone https://github.com/InterDigitalInc/CompressAI compressai cd
1
由五名研究人员和工程师组成的团队发布了《Deep Learning Tuning Playbook》,来自他们自己训练神经网络的实验结果以及工程师的一些实践建议,目前在Github上已有1.5k星。此版本为中文翻译版,提供给大家免费下载,因为本人知识水平有限,翻译过程中可能有误,随时欢迎大家指出错误,我会随时更正。
2025-04-05 19:28:23 2.5MB 深度学习 参数调节 经验手册
1
Transformers for Machine Learning A Deep Dive
2025-04-02 08:43:49 10.05MB 机器学习
1
### ICCV 2023:Parallax-Tolerant Unsupervised Deep Image Stitching #### 概述 本文介绍了一种新的图像拼接方法——Parallax-Tolerant Unsupervised Deep Image Stitching(UDIS++),该方法针对现有的图像拼接技术在处理大视差图像时遇到的问题进行了改进。UDIS++是一种无监督学习方法,能够在无需人工标记的情况下学习到鲁棒性强、适应性好的图像特征,从而实现高质量的图像拼接效果。 #### 背景与挑战 传统的图像拼接技术通常依赖于几何特征(如点、线、边缘等),这些手工设计的特征对于具备足够几何结构的自然场景表现良好。然而,在纹理较少或视差较大的情况下,传统方法的表现就会受到影响。例如,当面对大量视差时,基于学习的方法可能会模糊视差区域;而在低纹理场景下,传统的基于几何特征的方法则可能因缺乏足够的几何特征而失败。 #### 方法论 为了克服上述问题,研究团队提出了UDIS++,一种能够容忍视差变化的无监督深度图像拼接技术。该技术主要分为以下几个步骤: 1. **灵活的图像配准**:UDIS++通过一种从全局同构变换到局部薄板样条运动的鲁棒且灵活的配准方式来建模图像对齐过程。这种配准方法可以为重叠区域提供精确的对齐,并通过联合优化对齐和失真来保持非重叠区域的形状。 2. **增强的迭代策略**:为了提高模型的泛化能力,UDIS++还设计了一个简单但有效的迭代策略来增强配准适应性,尤其是在跨数据集和跨分辨率的应用中。 3. **消除视差伪影**:UDIS++进一步采取措施来消除视差伪影,确保最终的拼接结果既准确又自然。 #### 实验与验证 研究团队利用了UDIS-D数据集中的两个具体案例来验证UDIS++的有效性和优越性: 1. **大视差案例**:在这个案例中,研究人员展示了UDIS++如何有效地处理具有大视差的图像,相比于之前的方法(例如UDIS),UDIS++不仅没有模糊视差区域,而且还保持了高清晰度和连贯性。 2. **低纹理场景案例**:另一个案例则聚焦于低纹理场景下的图像拼接。与传统方法(如LPC)相比,UDIS++能够在缺乏足够几何特征的情况下成功地完成拼接任务,这得益于其强大的自适应学习能力和对复杂场景的理解。 #### 结论与展望 UDIS++作为一种新的图像拼接技术,不仅克服了现有方法在处理大视差和低纹理场景时的局限性,而且还在提高图像拼接质量方面取得了显著的进步。随着未来对这一领域研究的深入,预计UDIS++将在更多实际应用场景中发挥重要作用,如虚拟现实、自动驾驶等领域。此外,UDIS++的成功也为后续的研究提供了有价值的参考方向,即如何结合深度学习技术和传统几何特征提取方法来解决更广泛的实际问题。
2025-03-26 18:28:37 9.18MB 论文
1
在顶部的注释:该项目是未维护的。 基于变压器的对话框模型可以更好地工作,我们建议使用它们而不是基于RNN的CakeChat。 参见例如 CakeChat:情感生成对话系统 CakeChat是聊天机器人的后端,能够通过对话表达情感。 CakeChat是建立在和 。 该代码具有灵活性,并允许通过任意分类变量来调节模型的响应。 例如,您可以训练自己的基于角色的神经对话模型或创建情感聊天机 。 主要要求 python 3.5.2 张量流1.12.2 keras 2.2.4 目录 网络架构和功能 模型: 用于处理深层对话上下文的分层递归编码器-解码器(HRED)架构 。 具有GRU单元的多层RNN。 话语级编码器的第一层始终是双向的。 默认情况下,在推断过程中,使用CuDNNGRU实现可实现约25%的加速。 思想向量在每个解码步骤被馈送到解码器。 解码器可以以任何类别标签为条件,例如,情感标签或角色ID。 词嵌入层: 可以使用在您的语料库上训练的w2v模型进行初始化。 嵌入层可以与网络的其他权重一起固定或微调。 解码 4种不同的响应生成算法:“采样”,“ beamse
2025-03-26 08:39:20 466KB nlp deep-learning tensorflow keras
1
ILSVRC_2017.tar.gz 是一个包含ImageNet Large Scale Visual Recognition Challenge(ILSVRC)2017年比赛数据的压缩包文件。ImageNet是一个大规模的图像数据库,被广泛用于计算机视觉领域的研究,特别是深度学习模型的训练和评估。这个工具包特别针对的是2012年的数据集,它是TensorFlow官方指定的图像分类模型的评测工具,意味着它对于在TensorFlow框架下进行模型验证和比较是非常关键的。 ILSVRC是ImageNet挑战的一部分,旨在推动计算机视觉的发展,特别是图像分类和物体检测的任务。在这个比赛中,参与者需要对大量图片进行分类,这些图片涵盖了1000个不同的类别。这个数据集的特点在于其规模大、类别多,这对于训练深度学习模型的泛化能力非常有帮助。 TensorFlow是一个开源的机器学习库,尤其适用于深度学习模型的构建和训练。它提供了丰富的API,支持分布式计算,使得处理像ILSVRC这样大数据量的任务变得可能。当使用TensorFlow开发图像分类模型时,使用ILSVRC的数据集可以检验模型的性能,确保模型不仅能在训练集上表现良好,还能在未见过的数据上具有良好的泛化能力。 在ILSVRC_2017.tar.gz压缩包内,我们通常会找到以下几类文件: 1. 训练集(Training Set):大量的图片用于训练模型,每个图片都附带有其对应的类别标签。 2. 验证集(Validation Set):用于模型训练过程中的验证,不参与模型的训练,只用于调整模型参数和评估模型性能。 3. 测试集(Test Set):用于最终的模型评估,其真实类别不公开,参赛者需要提交预测结果,然后由官方评估准确度。 4. 类别索引(Class Index):一个文件,列出了1000个类别的名称和对应的ID,方便理解和分析结果。 5. 数据标注(Annotations):包含了关于每个图像的详细信息,如边界框(Bounding Boxes)对于物体检测任务。 深度学习在ImageNet上的成功,尤其是AlexNet、VGG、GoogLeNet和ResNet等模型,极大地推动了深度学习在计算机视觉领域的应用。通过ILSVRC数据集,研究人员可以测试和比较他们的创新模型,从而推动算法的进步。 总结来说,ILSVRC_2017.tar.gz是一个重要的资源,对于那些使用TensorFlow进行深度学习,尤其是图像分类研究的人员来说,它是必不可少的工具。这个压缩包提供了大量的图像数据,可以用来训练、验证和评估深度学习模型,促进模型在实际应用中的性能优化。
2025-01-15 20:51:09 16.22MB imagenet deep learning
1
HypeLCNN概述 该存储库包含论文“具有用于高光谱和激光雷达传感器数据的光谱和空间特征融合层的深度学习分类框架”的论文源代码(正在审查中) 使用Tensorflow 1.x开发(在1.10至1.15版上测试)。 该存储库包括一套完整的套件,用于基于神经网络的高光谱和激光雷达分类。 主要特点: 支持超参数估计 基于插件的神经网络实现(通过NNModel接口) 基于插件的数据集集成(通过DataLoader接口) 培训的数据有效实现(基于内存的有效/基于内存/记录的) 能够在经典机器学习方法中使用数据集集成 神经网络的培训,分类和指标集成 胶囊网络和神经网络的示例实现 基于CPU / GPU / TPU(进行中)的培训 基于GAN的数据增强器集成 交叉折叠验证支持 源代码可用于在训练大数据集中应用张量流,集成指标,合并两个不同的神经网络以进行数据增强的最佳实践 注意:数据集文件太
2024-10-09 21:46:44 128KB deep-neural-networks tensorflow fusion lidar
1
Deep Learning Toolbox Reference, Deep Learning Toolbox Reference, Deep Learning Toolbox Reference
2024-08-01 14:24:01 12.15MB matlab deep learning toolbox
1
github官网下载的,深度学习 with PyTorch 中文版, 项目网页地址:https://tangshusen.me/Deep-Learning-with-PyTorch-Chinese/#/ 基本摘录版(Essential Excerpts),共141页, 内容包括以下五个部分: 1.深度学习与PyTorch简介 2.从一个张量开始 3.使用张量表示真实数据 4.学习机制 5.使用神经网络拟合数据
2024-07-12 14:59:56 56.41MB python pytorch 深度学习
1
ACNet:通过非对称卷积块增强强大的CNN的内核骨架ACNet ICCV 2019论文:ACNet:通过非对称卷积块增强强大的CNN的内核骨架 其他实现:PaddlePaddle重新实现以构建ACNet和转换权重已被PaddlePaddle官方仓库接受。 @ parap1uie-s的出色工作! Tensorflow2:一个简单的插件模块(https://github.com/CXYCarson/TF_AcBlock)! 只需使用它来构建模型,然后调用deploy()即可将其转换为推理时结构! @CXYCarson的惊人作品
2024-07-10 17:38:53 145KB Python Deep Learning
1