内容概要:本文档详细介绍了一个利用USTC数据集并结合MediaPipe及YOLOv11算法来创建手语视频识别系统的方法。该系统的特色功能包括但不限于实时视频流的手势识别、高效数据处理流程、通过多种预处理技术和数据扩增手段提高了系统的鲁棒性和灵活性,且支持自定义识别设置,如调整信心分数门限和重叠比阈值。 适用人群:针对从事多媒体信号处理的研发团队、高校科研人员以及对手势识别技术感兴趣的工程专业人员。 使用场景及目标:用于手语视频识别的应用场景下测试或作为教育目的帮助学生学习手语翻译系统的设计理念与实践。具体目标为搭建一套能够精准识别手势且具有良好用户体验感的产品原型。 其他说明:文档提供了详尽的技术说明及相应的代码示例,涵盖了数据增强、目标检测和图形界面实现等部分的内容,并附带了完整的数据集和模型文件,利于直接导入并实验。
2025-03-16 22:28:08 40KB MediaPipe 手语识别 GUI界面
1
针对手脸遮挡条件下的手语视频手势检测问题,提出一种基于力场(force field)转换的手势检测算法。首先分别计算手脸遮挡帧和纯脸部帧的力场图像,然后将力场图像分块并统计各分块直方图特征,再将相同空间位置的分块直方图对应相减,得到各分块直方图灰度分量差,最后将各分块直方图灰度分量差与灰度阈值进行比较获得手部位置。实验证明该算法能够实时进行手脸遮挡条件下的手势检测。
1