在疯狂的实验中唇读 该存储库包含我在Keras中使用深度学习进行唇读的实验。 我训练并测试。 进程-lrw / 将LRW数据集中的视频转换为以下代码的代码:-与单词有关的帧-这些帧的嘴巴区域-音频 目录中的README文件中提供了说明。 形状预测器/ 放置process-lrw和head-pose所需的“ shape_predictor_68_face_landmarks.dat”文件的目录 图像检索/ 代码和文件---将lipreader视为图像检索系统 头姿势/ 代码和文件---计算LRW数据集中所有帧的头部姿势(使用process-lrw提取) 头部姿势是使用 (我的叉子)确定的。 目录中的README文件中提供了说明。
2022-02-22 23:04:07 133.4MB deep-learning facial-landmarks lip-reading Python
1
此为lip reading in the wild数据集的申请表
2021-05-31 14:02:59 54KB lipreading deeplearning
1
唇语识别系统使用机器视觉技术,从图像中连续识别出人脸,判断其中正在说话的人,提取此人连续的口型变化特征,随即将连续变化的特征输入到唇语识别模型中,识别出讲话人口型对应的发音,随后根据识别出的发音,计算出可能性最大的自然语言语句。
2021-03-02 20:13:47 84.98MB 人工智能 神经网络 深度学习 机器学习
1