CVPR 2025最新研究《SAIST: Segment Any Infrared Small Target Model Guided by Contrastive Language-Image Pretraining》提出了一种多模态红外小目标检测框架SAIST,通过结合文字描述和红外图像,显著提升了检测性能。该框架包含SR-CLIP和CG-SAM两个核心组件,前者实现图文交互,后者利用物理原理精准分割目标。研究还构建了首个多模态红外数据集MIRSTD,并在实验中展示了SAIST在复杂背景下的优异表现,误报率降低了一个数量级。这项技术在军事侦察、安防监控、海上救援等领域具有广泛应用前景。 SAIST多模态红外检测系统是一种先进的技术,它能够在复杂背景下高效准确地检测红外小目标。这项技术的核心在于结合了对比语言图像预训练(Contrastive Language-Image Pretraining,简称CLIP)的图文交互方法和基于物理原理的目标分割方法,形成了SAIST检测框架。具体来说,SAIST框架由SR-CLIP和CG-SAM两个关键组件构成。SR-CLIP利用深度学习技术实现文字描述与红外图像之间的交互,通过这种方法,系统能够更好地理解目标的语义信息和视觉特征,从而提升检测的精确度。而CG-SAM则是一种利用物理原理的图像分割方法,它能够精确地定位并分割目标,进一步提高了检测的准确性。 为了支持SAIST框架的研究与应用,研究者们还专门构建了一个多模态红外数据集,命名为MIRSTD。这个数据集收录了大量的红外图像以及对应的描述信息,为研究人员提供了丰富的实验素材。通过在MIRSTD数据集上的实验,SAIST显示出了优异的性能表现,特别是在降低误报率方面,达到了一个数量级的降低,这证明了SAIST在实际应用中的巨大潜力。 SAIST多模态红外检测技术的应用前景非常广阔,尤其是在军事侦察、安防监控、海上救援等领域。在军事侦察中,SAIST能够帮助快速定位敌方的隐蔽小目标,提高战场侦察能力。在安防监控方面,该技术可以用于监视危险区域,有效识别潜在威胁。在海上救援行动中,SAIST可用于搜寻失事船只或遇难者的热信号,提高救援效率和成功率。 此外,SAIST多模态红外检测技术的开源代码包,提供了丰富的源代码资源,这对于学术界和工业界的研究人员和工程师来说,是一个宝贵的资源。它不仅促进了相关领域的学术交流,也为实际应用开发和技术创新提供了基础。借助这些开源资源,开发者们可以更深入地研究SAIST框架的工作机制,进一步完善技术细节,推动该技术在更多领域的应用。 通过上述介绍,可以清楚地看到SAIST多模态红外检测系统的创新之处以及它对现代社会的意义。这项技术的提出和应用,不仅推动了红外小目标检测领域的发展,还为多个行业提供了高效可靠的检测工具,有望改善人们的生活质量和安全水平。
2026-03-18 21:46:19 5KB 软件开发 源码
1
优化、扩展USBEE逻辑分析仪自带红外解码功能,支持多钟红外协议自动识别。原自带红外解码只支持NECIR格式,并且时序比较严格导致解码不了。现优化时序,并且加入红外格式自动识别,目前只支持NECIR、RC5(2位地址位,7位数据位)两种最常用红外遥控格式。 注:原自带红外解码时输入NECIR (通道号),现只需输入IR (通道号)即可,软件自动识别红外格式并显示出来。
2026-03-18 16:39:28 14KB USBEE 红外解码 多钟红外格式
1
红外遥控技术在日常生活中广泛应用,例如电视、空调等家用电器的控制。NEC协议作为其中一种常见的红外遥控协议,它的理解和应用对于进行单片机控制和智能家居开发至关重要。本文将详细解析NEC协议的逻辑定义、协议格式以及重复码机制。 NEC协议的逻辑0和1的定义是基于发送端和接收端的波形差异。发送端,逻辑1表现为2.25毫秒的脉冲,紧接着560微秒的非脉冲时间,而逻辑0则是1.12毫秒的脉冲和同样长度的非脉冲时间。接收端则相反,逻辑1为2.25毫秒的低电平和560微秒的高电平(占空比3/4),逻辑0为1.12毫秒的低电平和560微秒的高电平(占空比1/2)。解码的关键在于识别这些脉冲的时间长度。 NEC协议的数据格式由同步码头、地址码、地址反码、命令码和命令反码构成。同步码头由9毫秒的脉冲和4.5毫秒的非脉冲时间组成,确保接收端能够准确识别信号的开始。接着是8位的地址码,其反码紧随其后,用于错误检查。之后是8位的命令码,同样伴随其反码。接收端需要按照正确的顺序接收这些信息。 当用户长时间按下遥控器的按键,NEC协议会发送重复码以保持指令的连续性。这种重复码由9毫秒的低电平、2.25毫秒的高电平以及560微秒的低电平组成,在发送端形成周期为110毫秒的信号。接收端则相应地识别出这个特殊的重复模式,维持设备的操作状态。 在实际应用中,理解NEC协议的这些细节对于设计和实现红外遥控系统至关重要。开发者需要根据协议规范设计电路,选择合适的红外发射和接收元件,并编写相应的解码程序,以确保红外遥控器的正确工作。此外,为了提高系统的稳定性和抗干扰能力,还需要考虑噪声过滤、信号整形以及错误检测与纠正机制。 NEC协议作为红外遥控领域的重要标准,通过其独特的波形定义和数据格式,为单片机控制提供了高效可靠的通信方式。无论是初学者还是资深工程师,掌握NEC协议都能为开发无线控制系统提供强大的支持。
2026-03-16 13:10:33 374KB NEC协议
1
本文详细介绍了2024年嵌入式FPGA竞赛国特-最佳创意奖作品——红外瞳孔追踪系统的设计与实现。该系统基于FPGA平台,通过红外窄带滤波摄像头捕获眼部图像,利用暗瞳效应产生的亮斑进行瞳孔定位。系统核心模块包括可控阈值二值化、多目标追踪定位、深色瞳孔提取、瞳孔坐标计算及实时画框叠加。作者分享了硬件基础、系统框图、关键模块代码(如binarization、VIP_multi_target_detect等)及功能模块(如rec_rst眨眼重置、cnt_all亮度调节)的实现细节。项目采用易灵思Ti60F100开发板,结合红外补光灯和特制摄像头,实现了眼动方向的八角定位和实时视频输出。文章还包含作者对大学学习经历的感悟,强调信息获取能力的重要性。 在当今科技不断进步的时代,人们对于人机交互的需求日益增长,特别是对于更加自然、直观的交互方式的需求。红外瞳孔追踪系统作为这一领域的一项创新技术,通过高精度的检测和追踪人的瞳孔运动,为实现更加丰富的交互方式提供了可能。基于FPGA平台的红外瞳孔追踪系统因其高度的实时性和准确性,受到众多研究者的关注和应用。 FPGA(Field-Programmable Gate Array,现场可编程门阵列)是一种可以通过软件编程来实现硬件逻辑功能的芯片。FPGA具有性能高、功耗低、可靠性高、可重复编程的特点,非常适合于需要高速处理的图像处理领域。在本项目中,研究者利用FPGA的这些特性,结合红外窄带滤波摄像头,开发了一套能够实时捕获眼部图像并准确定位瞳孔位置的系统。 该系统的核心功能模块包括可控阈值二值化、多目标追踪定位、深色瞳孔提取、瞳孔坐标计算及实时画框叠加等。通过这些模块的协同工作,系统能够准确识别和追踪瞳孔的位置变化。二值化模块能够将捕获的图像转换为黑白图像,便于后续处理;多目标追踪定位模块能够在动态场景中准确识别瞳孔目标;深色瞳孔提取模块能够从复杂的背景中提取出深色的瞳孔特征;瞳孔坐标计算模块则能够计算出瞳孔的精确位置;实时画框叠加模块则在显示设备上实时显示瞳孔追踪的可视化反馈。 在硬件实现方面,本项目采用的是易灵思Ti60F100开发板。该开发板搭载了性能强大的FPGA芯片,能够满足高速图像处理的需求。同时,项目还结合了红外补光灯和特制摄像头,以确保在各种光照条件下都能稳定地捕获眼部图像。系统框图和关键模块代码的详细分享,为后来的研究者提供了宝贵的参考资源。 在软件实现方面,作者提供了包括binarization、VIP_multi_target_detect等关键模块的代码实现细节,以及rec_rst眨眼重置、cnt_all亮度调节等功能模块的实现。这些代码和功能模块的设计与实现,展示了研究者在嵌入式系统设计方面的深厚功底和对细节的把控能力。 除了技术层面的探讨,作者还分享了自己在大学期间的学习经历和感悟,特别强调了信息获取能力的重要性。在当今信息爆炸的时代,如何快速有效地获取和筛选信息,对于科研人员来说是至关重要的能力。作者的经验之谈对于年轻的科研工作者具有很大的启发和指导意义。 此外,瞳孔追踪系统在多方面的应用潜力巨大,如虚拟现实、眼控交互、安全认证等领域。其能够为用户提供更为自然、直观的交互体验,并且在特定领域内可提供更为精确和可靠的人机交互方式。
2026-03-13 11:52:29 6KB FPGA开发 图像处理 嵌入式系统
1
内容概要:本文介绍了基于粒子群优化算法设计的近红外宽带消色差全偏振探测超透镜的研究成果及其应用案例。研究采用了椭圆形硅纳米柱结构,通过各向异性带来的色散关系和粒子群优化算法,在1310nm-1550nm波段实现了X、Y、45°线偏振和左旋圆偏振(LCP)四种偏振态的高效聚焦。文中详细描述了椭圆硅纳米柱的单元结构扫参模型、不同波长的相位参数计算、粒子群优化算法的应用,以及多偏振态集成超透镜的偏振探测结果。此外,还展示了该设计方案在可见光波段的成功移植,证明了其广泛的适用性和良好的扩展性。 适合人群:从事光学器件设计、超材料研究、粒子群优化算法应用的专业研究人员和技术爱好者。 使用场景及目标:适用于需要高性能偏振探测和消色差特性的光学系统设计,如高精度传感器、通信设备等领域。目标是提供一种高效的超透镜设计方案,能够在特定波段实现多种偏振态的同时聚焦,提高光学系统的性能和小型化程度。 其他说明:本文不仅提供了详细的理论分析和实验验证,还附带了完整的fdtd模型、设计脚本、Matlab计算代码和教程,便于读者理解和复现实验结果。
2026-03-11 16:47:16 2.7MB
1
本数据集是一个专为目标检测任务设计的红外图像数据集,适用于训练和评估基于YOLO框架的检测模型。数据集中包含了使用红外传感器采集的空中目标图像,涵盖了四种常见的空中目标类别:飞机 (Airplane)、鸟类 (Bird)、无人机 (Drone) 和直升机 (Helicopter)。 数据集已预先分割为训练集 (train)、验证集 (val) 和测试集 (test),便于直接用于模型的训练、调优和性能评估。该数据集对于开发和研究在复杂背景、低光照或夜间环境下的空中目标自动检测与识别算法具有重要价值,可广泛应用于安防监控、边境巡逻、无人机反制及航空管理等领域。
2026-03-06 14:24:36 50.71MB 计算机视觉 深度学习 目标检测
1
霍尼维尔ACM150傅里叶红外气体检测仪说明书
2026-03-04 19:55:28 20.72MB
1
内容概要:本文详细介绍了基于STM32F1系列微控制器的智能小车使用说明书,涵盖产品概述、功能模块、系统配置、操作指南及故障排除等内容。小车具备红外遥控、微信小程序远程控制、自动巡线和动态避障四大核心功能,集成ESP8266 WiFi模块、MPU6050姿态传感器、超声波与红外传感器等硬件,通过FreeRTOS实现多任务调度。系统支持多种控制模式切换,结合百度云物联网平台实现远程通信,并提供完整的软硬件配置说明与调试方法。; 适合人群:具备嵌入式系统基础知识的高校学生、电子爱好者、物联网开发者及从事智能硬件研发的工程师;适用于学习STM32开发、FreeRTOS应用、传感器融合与物联网通信的技术人员。; 使用场景及目标:①用于嵌入式教学实验平台,掌握STM32外设驱动与综合项目开发;②实现远程物联控制与自动导航功能验证;③开展智能机器人算法研究,如PID调速、路径规划与避障策略设计;④支持二次开发拓展视觉识别或机械臂等功能。;
2026-02-25 18:21:04 2.55MB STM32 FreeRTOS 智能小车 PID控制
1
采用新型高速DSP器件TMS320C6455和高性能的Spartan-6系列FPGA设计了图像融合处理系统。分析了系统的设计原理及硬件结构设计方法,并对系统中各功能模块进行了介绍。实际应用表明:该系统具有实时性和准确性的特点。
2026-02-07 20:43:15 961KB 自然科学 论文
1
为实现对装药过程中实时温度的检测,设计了一套C8051F340单片机与时分复用技术进行数据采集和通信的多通道温度采集系统。实验验证了CPLD在进行分时控制时具有计时准确,门选电路设计方便,集成度高的优点,同时结合Silicon Laboratories公司提供的USBXpress开发工具使得单片机与计算机的USB通信实现变得极为简便。
2026-01-31 12:48:57 179KB C8051F340 CPLD 温度监测
1