计算机视觉(模型、学习和推理)Algorithms算法伪代码 AnswerBookletStudents常见问题 Computer vision models, learning and inference CVMmatlab代码
2025-06-22 11:25:00 212.75MB 计算机视觉
1
本项目提供了一个完整的工程化Demo,演示如何将Rockchip官方RKNN Toolkit中的YOLOv5示例高效迁移到安卓应用环境。主要特性包括: 边缘计算优化:充分利用RK3588芯片的NPU加速能力,实现移动端实时目标检测 全流程实现:包含安卓JNI接口封装到前处理/后处理的解决方案 工程化适配:解决了RKNN模型在安卓环境的部署难题,提供可复用的代码框架 代码结构清晰,包含: 安卓JNI接口实现(C++) 示例APK源码(Java/Kotlin) 预编译的RKNN模型文件 本Demo适合希望了解以下技术的开发者: 边缘计算设备上的AI推理部署 Rockchip NPU的安卓开发实践 YOLOv5模型在移动端的优化实现 通过此项目,开发者可以快速掌握RK3588平台的AI应用开发流程,为产品级应用开发奠定基础。
2025-06-11 20:22:32 11.26MB yolov5 android
1
该文档描述的是一个基于模糊逻辑的洗衣机控制系统的设计,主要由洪杨潇同学完成,作为《人工智能导论》课程的大作业。该系统旨在设计一个全自动洗衣机模糊控制器,以提高洗衣机的智能化程度和洗涤效果。 1. **模糊控制系统**:模糊系统是一种处理模糊信息的理论,它模拟人类的模糊思维,适用于处理非线性和不确定性问题。在洗衣机模糊控制系统中,模糊逻辑用于处理传感器(如负载、衣质、水位、水温、洗涤剂类型)检测到的数据,进行模糊化处理和推理,以优化控制参数(水流、水位、洗涤时间、清洗方式和脱水时间)。 2. **系统硬件设计**:硬件部分涉及各种传感器,如负载传感器、水质传感器、水位传感器和温度传感器,它们将数据传输给单片机。单片机根据接收到的信息进行模糊评估和推理,从而决定最佳的洗涤参数。 3. **系统软件设计**:软件部分包括定义输入(肮脏度、衣量、衣质)和输出(洗涤时间和水流强度)的模糊语言变量的隶属函数,以及制定连接输入到输出的模糊规则表。反模糊化过程用于将模糊结果转换为具体的数值。 4. **系统总体设计**:系统包含六个主要模块:系统初始化、信号检测与处理、模糊推理、中断处理、显示输出和过载报警。模糊推理在洗涤前完成,检测模块收集输入数据,推理模块确定输出,然后开始洗涤。在洗涤过程中,系统能够实时监控并处理异常情况。 5. **应用领域**:模糊逻辑控制系统在洗衣机中的应用,提高了洗衣机的自动化程度,使得洗衣机能够根据衣物类型、重量和污渍程度自动调整工作模式,提高了洗涤效率和用户便利性。 6. **发展趋势**:随着人工智能和物联网技术的发展,洗衣机模糊控制系统有望进一步升级,例如集成更多传感器,实现更智能的自我诊断和远程控制功能,提升用户体验。 这个模糊推理系统展示了人工智能在家电领域的应用,体现了模糊逻辑在处理不确定性和非线性问题上的优势,有助于实现更加节能、高效和人性化的家用电器。
2025-06-09 00:08:54 280KB
1
近半年一直用瑞星微的芯片做项目,一开始并没有使用它的rknn框架,直到其它难点全部攻克后正好是2025年春节放假了,又正好这次没有旅游计划,所以在才有时间研究一下,发现rknn真是个好东西,就想把它封装到Delphi中,于是就有了我这个 rknn4Delphi 目前只写了图像识别和图像分类 2个模块,并且已开源到 github: 随着人工智能技术的飞速发展,将机器学习模型应用于各类软件开发中已成为一种趋势。瑞星微作为一家知名的半导体公司,其推出的RKNN(Rockchip Neural Network)推理框架在边缘计算领域表现不凡。RKNN为开发者提供了一种高效、便捷的方式来部署神经网络模型到基于瑞星微芯片的设备上。在此基础上,探索将RKNN框架封装进Delphi编程语言的实践中,无疑对于拓宽Delphi的应用场景和提升其处理复杂算法的能力有着重要的意义。 Delphi作为一种快速应用开发工具,其简洁的语法、强大的编译器和丰富的组件库使得它在桌面应用程序的开发中占据一席之地。然而,在处理深度学习、图像处理等人工智能相关任务时,Delphi本身的功能相对有限。通过封装RKNN框架,开发者能够利用RKNN高效的数据处理能力,在Delphi环境下实现复杂的图像识别和分类功能,这无疑增强了Delphi的应用范围和竞争力。 本项目名为rknn4Delphi,它主要包含了图像识别和图像分类两个模块,这两个模块是计算机视觉中最为基础且应用广泛的领域。图像识别主要涉及到从图像中识别出特定的物体或者模式,而图像分类则是将图像划分到不同的类别中。rknn4Delphi封装了RKNN框架后,能够支持开发者将训练好的神经网络模型部署到使用Delphi开发的应用程序中,从而实现快速准确的图像处理能力。 此外,rknn4Delphi已经被开源到GitHub上,这为全球的开发者社区提供了一个宝贵的资源。开源意味着更多的开发者可以参与到这个项目的完善中来,不仅能够利用此框架加速自己的项目开发,还能够对rknn4Delphi进行改进和扩展,使其适应更多特定的业务需求和硬件平台。开源的做法也符合当前软件开发领域提倡的协作和共享精神,有助于形成一个更加开放和活跃的开发者社区。 至于rknn4Delphi如何在实际应用中发挥作用,我们可以想象一个典型的场景:在零售行业,通过摄像头收集的顾客购买行为视频流可以被rknn4Delphi处理,以识别商品种类并统计各类商品的销售情况。这不仅能够帮助商家更精准地进行库存管理和销售策略的制定,还可以为顾客提供个性化的购物体验。在医疗领域,rknn4Delphi也可以辅助医生进行疾病的早期诊断,通过图像识别技术快速检测出病变组织,从而提高诊断的准确率和效率。 rknn4Delphi作为将RKNN框架成功封装进Delphi环境的项目,对于想要在Delphi中实现深度学习应用的开发者来说,是一个非常有价值的学习和工作资源。它不仅降低了技术门槛,还促进了技术的创新和应用,有望推动Delphi在新时代中的发展。同时,rknn4Delphi的开源性质也为全球开发者带来了便利,有助于形成一个互助合作的技术社区。
2025-05-26 20:52:07 16.12MB delphi
1
在人工智能领域,随着深度学习技术的快速发展,大模型微调技术成为了一项重要的研究方向。模型微调,尤其是针对预训练语言模型的微调,已经成为提高特定任务性能的有力手段。本文将介绍如何使用LoRA技术进行qwen模型的微调,以期优化模型的推理效果。LoRA,即Low-Rank Adaptation,是一种新颖的参数高效微调方法,它通过引入低秩分解来调整预训练模型的权重,显著减少了微调时所需的计算资源和存储成本。 在进行模型微调之前,首先需要准备相应的数据集文件。这些数据集需要覆盖所期望训练模型执行的任务领域,以确保微调后的模型能够适应具体的应用场景。例如,如果目标是进行自然语言处理任务,那么就需要准备大量的文本数据,包括标注数据和未标注数据。数据集的选择和质量对最终模型的性能有着直接的影响。 训练环境的搭建是模型微调的第二个重要步骤。由于使用了LoRA技术,因此需要配置支持该技术的深度学习框架和计算资源。在教程中,会提供详细的环境搭建指南,包括必要的软件安装、依赖项配置、以及可能需要的硬件配置建议。对于初学者而言,这一部分的教程能够帮助他们快速进入模型微调的学习状态,无需过多地担心环境搭建的问题。 接着,我们将详细解析LoRA微调的python代码。在代码中,会具体展示如何加载预训练的qwen模型,如何应用LoRA进行微调,以及如何在特定的数据集上进行训练。代码部分不仅包含模型的调用和微调,还包括了如何保存和加载微调后的模型,以及如何评估微调模型的效果。通过这些实际的代码操作,初学者可以清晰地理解模型微调的整个流程,并掌握相应的技能。 LoRA微调方法的核心优势在于其高效率和低资源消耗。在微调过程中,LoRA技术通过低秩分解来寻找最有效的权重更新方式,这意味着在更新模型时只需要对少量的参数进行调整。这样不仅节约了存储空间,也减少了训练时间,特别适合于资源受限的环境,如边缘计算设备或移动设备。 此外,本资源还特别适合初学者使用。它从基础的模型微调概念讲起,逐步深入到LoRA微调的具体技术细节。通过实例化的教程和代码,初学者能够循序渐进地学习并实践大模型微调技术。通过本资源的学习,初学者不仅能够理解模型微调的基本原理,还能掌握实际操作技能,并能够将所学应用到实际项目中去。 在总结以上内容后,本资源的实用性便不言而喻。无论是对于从事人工智能研究的专业人员,还是对于刚接触模型微调的初学者,本资源都提供了一个很好的起点,帮助他们快速理解和掌握LoRA微调技术,有效地优化模型的推理效果。通过这份资源,用户可以更容易地将先进的模型微调技术应用于自己的项目中,提升人工智能应用的性能和效率。
2025-05-26 10:42:15 132KB 人工智能 LoRA
1
使用C#进行Yolo模型的Predict和Segment两个场景的训练及推理,包括Yolov5、Yolov8、Yolov11,尺寸覆盖n、s、l、m、l、x的大小。本压缩包中只包含了各模型的n大小的预训练权重,更多尺寸的预训练权重请在 https://github.com/IntptrMax/YoloSharp下载。 另外该项目已经打包成dll并发布在了Nuget上,使用IntptrMax.YoloSharp即可直接使用。 随着深度学习技术的不断进步,目标检测模型在各种智能系统中的应用变得越来越广泛。Yolo(You Only Look Once)模型作为一种流行的目标检测框架,以其速度快、准确度高而受到开发者的青睐。在C#中训练和推理Yolo模型,允许开发者将先进的目标检测功能集成到.NET平台的应用程序中,拓展了这些应用的适用场景。 本项目主要关注于使用C#语言进行Yolo模型的Predict和Segment训练及推理。项目中涉及的Yolo模型包括Yolov5、Yolov8和Yolov11,这些模型是Yolo家族中的不同版本,每个版本针对目标检测任务的性能和特点进行了优化。在不同的应用场景中,可以选择适合的模型版本来实现目标检测。 此外,模型尺寸的选择也对性能和效率有着重要影响。Yolo模型提供了多种尺寸覆盖(n、s、m、l、x),以适应不同计算资源和精度需求。本压缩包特别包含了n尺寸的预训练权重,用户可以基于这些权重进行进一步的训练或直接应用于推理任务。对于其他尺寸的预训练权重,开发者可以通过提供的链接访问GitHub上的相关项目进行下载。 值得一提的是,本项目已经将核心功能封装成dll动态链接库,并发布在了Nuget上。这意味着开发者可以通过简单的包管理命令安装并直接使用YoloSharp库。使用IntptrMax.YoloSharp包,开发者可以轻松地在自己的C#应用程序中集成Yolo模型,进行图像的目标检测和分割。 利用Yolo模型进行Predict,开发者可以训练模型识别图像中的特定目标,并进行分类和定位。而对于Segment场景,Yolo模型可以进行像素级的目标分割,区分图像中不同的物体区域,这对于图像理解和处理具有更深层次的意义。这两种训练和推理的场景对于安防监控、自动驾驶辅助、图像内容审核等应用领域具有重要的应用价值。 本项目为C#开发者提供了一个便捷的工具,使得在.NET平台上实现复杂的目标检测和图像分割任务成为可能。开发者不仅可以通过现有的预训练权重快速开始项目,还可以根据需要自定义训练过程,以及下载其他尺寸的权重以满足不同应用场景的需求。借助Nuget包管理和GitHub资源,项目具有良好的扩展性和社区支持,是推动智能应用开发的重要工具。
2025-05-24 21:33:22 51.75MB yolo
1
针对现有基于注意力机制的多模态学习,对文字上下文之间的自我联系和图像目标区域的空间位置关系进行了深入研究。在分析现有注意力网络的基础上,提出使用自注意力模块(self-attention,SA)和空间推理注意力模块(spatial reasoning attention,SRA)对文本信息和图像目标进行映射,最终得到融合特征输出。相较于其他注意力机制,SA和SRA可以更好地将文本信息匹配图像目标区域。模型在VQAv2数据集上进行训练和验证,并在VQAv2数据集上达到了64.01%的准确率。
2025-05-23 16:00:37 1018KB 视觉问答 注意力机制
1
什么 这是在Unity应用程序中使用经过TensorFlow或ONNX训练的模型进行图像分类和对象检测的示例。 它使用-请注意,梭子鱼仍处于开发预览阶段,并且经常更改。 在我的更多详细信息。 分类结果: 检测结果: 如果您正在寻找类似的示例,但使用TensorflowSharp插件而不是梭子鱼,请参阅我 。 怎么样 您需要Unity 2019.3或更高版本。 2019.2.x版本似乎在WebCamTexture和Vulkan中存在一个错误,导致内存泄漏。 在Unity中打开项目。 从Window -> Package Maanger安装Barracuda 0.4.0-preview
2025-05-16 15:45:26 147.01MB deep-learning unity tensorflow image-classification
1
本文针对当前IH电磁加热电饭锅,采用单片机控制技术,运用模糊逻辑控制原理进行系统控制设计。文中对整个控制系统的工作机制作了全面的论述,特别是对电饭锅整个煮饭加热过程模糊逻辑控制、米量测定模糊推理的算法作了深入的分析,并给出了模糊逻辑温控程序代码。实践证明,模糊逻辑控制的IH电磁加热电饭锅,米量判断准确,受热均匀,煮饭加温工艺曲线符合要求,智能化程度高。
2025-04-25 14:31:09 1.43MB 模糊推理
1
内容概要:本文为2025北森测评题库(无答案版),涵盖言语理解推理题、资料分析题和图形推理题三大板块。言语理解推理题涉及高新科技成果转化、传统节日的历史、逻辑推理等;资料分析题通过图表和数据,考察对各类经济、销售、人口等数据的理解与分析能力;图形推理题则通过一系列图形,测试考生的图形识别和规律推理能力。这些题目旨在全面评估考生的逻辑思维、数据分析和图形理解能力。 适用人群:适用于准备参加北森测评的求职者或相关人员,特别是那些希望提升自己在逻辑推理、数据分析和图形理解方面能力的考生。 使用场景及目标:①帮助求职者熟悉北森测评的题型和难度,提高应试技巧;②通过练习题库中的题目,增强考生在言语理解、资料分析和图形推理方面的能力;③为人力资源从业者提供一份参考题库,用于评估候选人的综合素质。 其他说明:本文档未提供答案,考生需自行分析解答。题库中的题目类型多样,涵盖了多个领域和知识点,具有较强的实用性和针对性,适合在备考或日常练习中使用。题目不仅考察考生的基础知识,还注重考察其实际问题解决能力和创新思维。
2025-04-15 16:49:34 6.06MB 教育评估 职业技能 公务员考试
1