为了避免人与物体之间相互遮挡,对小目标检测不准确,以及复杂光照强度对行人
检测的影响,针对这一问题,提出了一种多尺度聚类卷积神经网络 MK-YOLOv3 算法,来实现对行人的识别与检测。该算法是对 YOLOV3 进行改进,首先通过简单聚类对图像特征进行提取,得到相应的特征图,再通过抽样 K-means 聚类算法结合核函数确定锚点位置,以达到更好的聚类。针对小目标的浅层特征信息进行多尺度融合,提高小目标的检测效果。仿真结果验证了该算法在 VOC 数据集上对小目标识别的精度和速度上有较大提高,以及视频智能分析中有较高的召回率和精确度。