在疯狂的实验中唇读
该存储库包含我在Keras中使用深度学习进行唇读的实验。 我训练并测试。
进程-lrw /
将LRW数据集中的视频转换为以下代码的代码:-与单词有关的帧-这些帧的嘴巴区域-音频
目录中的README文件中提供了说明。
形状预测器/
放置process-lrw和head-pose所需的“ shape_predictor_68_face_landmarks.dat”文件的目录
图像检索/
代码和文件---将lipreader视为图像检索系统
头姿势/
代码和文件---计算LRW数据集中所有帧的头部姿势(使用process-lrw提取)
头部姿势是使用 (我的叉子)确定的。
目录中的README文件中提供了说明。
1