内容概要:本文档是关于海光 DCU DeepSeek-R1/V3部署指南,发布于2025年5月9日。DeepSeek-R1和 DeepSeek-V3是深度求索公司开发的高性能自然语言处理模型,前者专注于复杂逻辑推理任务,后者为通用NLP模型。文档详细介绍了在海光 DCU上部署 DeepSeek推理环境所需的步骤,包括基础环境依赖安装(如 DCU驱动和 Docker安装)、模型下载方式(推荐三种下载渠道:SCNet超算互联网、Huggingface、Modelscope)、不同型号 DCU的推理环境部署(针对 K100AI和 Z100/K100系列,使用 vllm、ollama、Pytorch框架)、以及 Webui+server可视化交互部署。此外,还提供了详细的命令行示例和环境变量设置说明。 适合人群:具备一定Linux系统管理和深度学习框架使用经验的IT技术人员或运维人员,特别是从事自然语言处理和AI模型部署的相关人员。 使用场景及目标:①为用户提供详细的步骤指导,确保在海光 DCU上顺利部署 DeepSeek模型;②帮助用户理解各个框架(vllm、ollama、Pytorch)的具体配置和使用方法;③提供模型下载和环境变量设置的详细说明,确保模型能够高效运行;④通过可视化交互工具(如 Anythingllm和 DCU智能助手),提升用户体验和操作便捷性。 其他说明:文档附带了丰富的参考链接,涵盖了从基础环境搭建到高级模型推理的各个方面,为用户提供全面的技术支持。同时,文档提供了多种模型下载渠道和预配置的 Docker镜像下载链接,便于用户快速获取所需资源。
2025-09-08 14:12:32 1.05MB Docker Pytorch
1
用于mobilesam的C++部署 MobileNet是一个轻量级的深度神经网络模型,特别设计用于移动和嵌入式设备。而ONNX是一个开放的神经网络模型交换格式,可以让不同的深度学习框架之间共享模型,实现模型的跨平台部署。MobileNet的预处理一般指将输入图像进行归一化、尺寸调整等操作,以便输入到模型中进行推理。在使用MobileNet模型时,通常需要对输入图像进行预处理,然后再将预处理后的图像输入到模型中进行推理。 运行轻量级模型: MobileNet是一种轻量级的深度神经网络模型,具有较少的参数和计算量,适用于移动和嵌入式设备。这意味着在这些资源受限的环境下,可以更高效地进行推理。 跨平台部署: 使用ONNX格式将MobileNet模型导出后,可以轻松地在不同的深度学习框架之间进行共享和部署。这使得在不同的平台上,如移动设备、服务器端等,都可以方便地使用MobileNet模型进行推理。 开放标准: ONNX是一个开放的神经网络模型交换格式,得到了业界广泛的支持。这意味着可以通过ONNX格式与其他框架(如TensorFlow、PyTorch等)进行互操作,促进了模型的开发和部署的
2025-09-07 21:55:48 22.99MB pytorch 人工智能 模型部署
1
内容概要:本文详细介绍了如何使用Anaconda无痛配置PyTorch环境,涵盖从准备工作到最终测试验证的全过程。文章首先强调了深度学习的重要性,特别是PyTorch和Anaconda在其中的作用。接着逐步讲解了Anaconda的安装、conda环境的配置、国内镜像源的添加、PyTorch的安装(包括官网和本地安装方式),并提供了详细的命令示例。最后,通过测试代码验证了PyTorch的安装是否成功,并列举了常见问题及解决方法。 适合人群:对深度学习感兴趣的初学者及希望提升开发效率的进阶者,尤其是使用Windows、macOS或Linux系统的用户。 使用场景及目标:①帮助用户快速搭建深度学习环境,避免因环境配置问题耽误开发进度;②提供详细的安装步骤和命令,确保用户顺利完成配置;③通过测试代码验证安装结果,确保环境正常运行;④解决常见的配置问题,如网络问题、版本不兼容、环境变量配置错误等。 其他说明:本文不仅提供了详细的安装指南,还涵盖了深度学习的基础知识和技术背景,帮助读者更好地理解和掌握配置过程。建议读者在实践中结合官方文档和技术论坛,遇到问题时积极寻求帮助和交流,持续学习和探索深度学习领域的最新进展。
2025-09-05 22:21:49 230KB PyTorch Anaconda CUDA 深度学习
1
# 基于Python和PyTorch的Mean Teacher模型 ## 项目简介 本项目实现了基于Mean Teacher模型的半监督学习方法,用于训练CIFAR10数据集。Mean Teacher模型通过引入一个Mean Teacher模型来增强模型的鲁棒性,使用有标签和无标签的数据联合训练模型,提高模型的性能。 ## 项目的主要特性和功能 1. Mean Teacher模型: 使用有标签和无标签的数据联合训练模型,通过计算模型输出和Mean Teacher模型的输出的差异(一致性损失)来增强模型的鲁棒性。 2. 一致性损失: 在训练过程中,除了常规的交叉熵损失外,还计算了模型输出和Mean Teacher模型输出的均方误差(MSE)作为一致性损失。 3. 参数更新: 在每个训练批次后,更新模型的权重,并更新Mean Teacher模型的参数(通过加权平均)。
2025-09-05 16:08:18 1.33MB
1
在本项目中,开发者利用了深度学习技术,特别是卷积神经网络(CNN)以及U-Net模型,结合OpenCV库(cv2),实现了一个针对中文车牌的定位、矫正和端到端识别系统。这个系统展示了如何将先进的计算机视觉技术与深度学习算法相结合,以解决实际的图像处理问题。 U-Net是一种特殊的卷积神经网络架构,广泛应用于图像分割任务,包括对象检测和定位。其特点是具有对称的收缩和扩张路径,收缩路径负责捕获上下文信息,而扩张路径则用于精确地恢复对象细节。在车牌定位中,U-Net可以高效地找出图像中的车牌区域,生成对应的掩模,从而帮助确定车牌的位置。 OpenCV(Open Source Computer Vision Library)是一个开源的计算机视觉库,包含了大量的图像处理和计算机视觉的算法。在这里,它被用来对定位后的车牌进行图像矫正。OpenCV可以执行图像变换,如旋转、缩放和仿射变换,以确保即使车牌角度不正,也能得到正向展示的图像,这为后续的字符识别步骤打下基础。 接下来,卷积神经网络(CNN)是深度学习中的核心组件,尤其在图像识别任务中表现出色。在这个项目中,CNN模型被训练来识别经过定位和矫正后的车牌上的字符。CNN通过学习多个卷积层和池化层,能自动提取图像特征,并在全连接层进行分类。训练过程中,可能使用了TensorFlow这一强大的深度学习框架,它提供了丰富的工具和接口,简化了模型构建和训练的过程。 TensorFlow是谷歌开发的开源平台,用于构建和部署机器学习模型。它支持数据流图的构建,允许开发者定义计算流程,然后在CPU或GPU上高效执行。在车牌字符识别阶段,开发者可能构建了一个CNN模型,用大量的带标签车牌图像进行训练,使得模型能够学习到中文字符的特征,达到高精度的识别效果。 这个项目综合运用了深度学习(如U-Net和CNN)、计算机视觉(OpenCV)和强大的开发工具(TensorFlow),实现了对中文车牌的精准定位、矫正和字符识别。这样的端到端解决方案对于智能交通、安防监控等领域有着重要的应用价值,同时也展示了深度学习在解决复杂图像识别问题上的强大能力。通过深入理解和实践这些技术,开发者可以进一步优化模型性能,提升系统在实际环境中的应用效果。
2025-09-04 02:09:30 27.73MB 人工智能 深度学习 tensorflow
1
实战 Kaggle 比赛:图像分类 (CIFAR-10 PyTorch版)
2025-09-01 09:33:37 2.34MB
1
体素姿势 这是以下方面的官方实现: , 屠含月,王春雨,曾文俊ECCV 2020(口服)( ) 安装 克隆此仓库,我们将克隆multiview-multiperson-pose的目录称为$ {POSE_ROOT}。 安装依赖项。 资料准备 货架/校园数据集 从下载数据集,并将其分别提取到${POSE_ROOT}/data/Shelf和${POSE_ROOT}/data/CampusSeq1 。 我们已经将相机参数处理为我们的格式,您可以从此存储库下载它们。 它们分别位于${POSE_ROOT}/data/Shelf/和${POSE_ROOT}/data/CampusSeq1/ 。 由于两个数据集的注释有限且不完整,因此我们不使用该数据集训练模型。 相反,我们直接使用在COCO上训练的2D姿态估计器,并使用Panoptic数据集中的独立3D人类姿态来训练3D模型。 它位于${PO
2025-08-28 16:34:16 67.8MB Python
1
内容概要:本文系统阐述了端到端自动驾驶系统的完整实现链路,从Comma.ai架构解析到PyTorch模型训练,再到TensorRT部署优化,最后实现安全接管机制。文章首先介绍了端到端架构的技术背景及其相对于传统分模块处理的优势。接着,详细描述了系统架构设计,包括多模态传感器融合方案(如摄像头+雷达+IMU的时空对齐)和神经网络架构设计(如3D卷积+LSTM的时空特征提取)。然后,讲解了数据采集、数据增强策略及模型训练与优化的具体方法。此外,还探讨了安全接管机制的实现,如多模态接管预警系统和故障安全降级策略。最后,通过闭环测试框架和性能基准测试评估系统性能,并提出了未来的发展方向,如引入Transformer架构、强化学习等。 适合人群:对自动驾驶技术感兴趣的工程师、研究人员以及有一定编程基础并希望深入了解端到端自动驾驶系统设计与实现的专业人士。 使用场景及目标:①帮助读者理解端到端自动驾驶系统的工作原理和技术细节;②指导读者使用Comma.ai架构和PyTorch框架构建高性能自动驾驶模型;③提供安全接管机制的设计思路,确保系统在异常情况下的可靠性。 其他说明:本文不仅提供了理论知识,还附有详细的代码示例,涵盖了从数据采集到模型部署的各个环节。同时,文中还展示了性能测试结果,为实际应用提供了参考依据。未来发展方向的讨论也为进一步研究指明了路径。
2025-08-27 17:20:50 191KB 自动驾驶 PyTorch TensorRT 深度学习
1
内容概要:文章展示了一个用于故障检测的深度学习项目,采用PyTorch构建了一个一维卷积神经网络(CNN),针对工业故障诊断问题。文中详细地解释了从数据加载、预处理、模型搭建、训练到性能评估的全过程。通过归一化原始数据集,设计多层一维卷积与全局最大池化的网络架构,并应用交叉熵作为损失函数,利用Adam算法进行梯度下降最优化,最终实现了高精度的分类任务。 适用人群:对于机器学习尤其是深度学习领域感兴趣的科研人员或者工程师,特别是那些想要深入了解或实操如何使用深度学习技术解决实际问题如工业设备状态监测的研究者和技术开发者。 使用场景及目标:本项目的目的是为了提高机械设备运行状态监控系统的效率与准确性,可以应用于制造业、电力等行业,帮助实时监控设备健康状况,及时发现潜在故障点,从而减少非计划停机时间和维修成本。 其他说明:除了提供了一套完整的解决方案之外,本文还展示了如何计算模型的参数量,以便于控制模型复杂度。此外,文中也包含了模型训练过程中每轮迭代的耗时记录,这对于大规模数据集下优化算法选择具有重要参考价值。
2025-08-25 17:45:48 3KB 神经网络 故障检测 代码复现
1
内容概要:本文详尽介绍了 PyTorch 1.4.0 在不同操作系统上基于 CPU 和 CUDA 环境下的安装步骤。首先强调了 Python 环境及包管理工具 (如 pip 或 conda) 是前提条件;然后分别演示了通过 Anaconda 创建并激活虚拟环境中安装 PyTorch 的方法,提供了适用于不同版本 CUDA 的安装指令;接着讲述了直接利用 pip 来完成相同工作的流程。最后提供简单的验证脚本来确认是否安装正确。 适用人群:想要将 PyTorch 库应用于研究项目或生产环境的新手开发者、研究人员以及数据科学家。 使用场景及目标:①帮助用户搭建适合深度学习任务运行所需的软件平台;②引导使用者掌握从配置到验证完整设置过程的具体步骤,确保后续开发活动可以顺利开展。 其他说明:由于该文档针对的是具体版本(即 PyTorch 1.4.0),请注意官方可能已发布更新版本,安装前务必查阅官网获取最新指南。对于更高版本的需求,请参见相关资料以获得相应指导。
2025-08-22 16:55:40 2KB PyTorch CUDA pip Anaconda
1