基于Visual Transformer的年龄估计
尝试Visual Transformer的有趣项目,花了几天时间。
自动化的年龄和性别估算在许多应用中变得至关重要。 有多种方法可以根据人的声音,面部特征和姿势来预测年龄和性别。 在本文中,将研究基于图像的方法。 该方法需要人脸的二维图像。 这种方法的挑战性问题是,在不受限制的环境中对脸部进行实验时,其性能会大大降低。 另一个问题是基于个人生活方式,遗传和环境的老龄化差异。 简单地说,不同的人年龄不同。 另一个挑战是生物年龄和表观年龄之间的区别。 基于面部图像的方法有两种。 第一个是手工进行的特征提取和分类,第二个使用深度神经网络。 在我们的论文中,我们还提出了用于年龄估计的视觉转换器。 它是最早提出用于面部任务的视觉转换器之一,因此没有预训练的模型。 但是,我们仍然设法在低数据环境中取得一些成果。 未来的步骤将是在较大的面部数据集上对
1