在疯狂的实验中唇读 该存储库包含我在Keras中使用深度学习进行唇读的实验。 我训练并测试。 进程-lrw / 将LRW数据集中的视频转换为以下代码的代码:-与单词有关的帧-这些帧的嘴巴区域-音频 目录中的README文件中提供了说明。 形状预测器/ 放置process-lrw和head-pose所需的“ shape_predictor_68_face_landmarks.dat”文件的目录 图像检索/ 代码和文件---将lipreader视为图像检索系统 头姿势/ 代码和文件---计算LRW数据集中所有帧的头部姿势(使用process-lrw提取) 头部姿势是使用 (我的叉子)确定的。 目录中的README文件中提供了说明。
2022-02-22 23:04:07 133.4MB deep-learning facial-landmarks lip-reading Python
1
LRS2数据集的预训练文件列表
2021-12-09 11:07:59 2.48MB lipreading DeepLearning
1
lrs3_pretrain_partaa
2021-10-14 12:08:29 121B lipreading deeplearning
1
lrs3_pretrain_partab
2021-10-14 12:08:29 121B lipreading deeplearning
1
lrs3_pretrain_partac
2021-10-14 12:08:28 121B lipreading deeplearning
1
lrs3_pretrain_partad
2021-10-14 12:08:28 121B lipreading deeplearning
1
lrs3_pretrain_partae
2021-10-14 12:08:27 121B lipreading deeplearning
1
lrs3_pretrain_partaf
2021-10-14 12:08:27 121B lipreading deeplearning
1
lrs3_pretrain_partag
2021-10-14 12:08:26 121B lipreading deeplearning
1
lrs3_test_v0.4.zip
2021-10-14 12:08:26 121B lipreading deeplearning
1