使用深度神经网络的光学音乐识别 抽象的 光学音乐识别是一个充满挑战的领域,在许多方面都与光学文本识别类似。 但是,它带来了传统的基于管道的识别系统所面临的许多挑战。 在手写文本识别领域,端到端方法已被证明是优越的。 我们试图将这种方法应用于OMR领域。 具体来说,我们专注于手写音乐识别。 为了解决培训数据的不足,我们开发了一种用于手写音乐的雕刻系统,称为Mashcima。 此雕刻系统成功模仿了CVC-MUSCIMA数据集的样式。 我们在CVC-MUSCIMA数据集的一部分上评估了我们的模型,这种方法似乎很有希望。 论文文本 您可以在阅读整个论文 在新机器上设置 确保已安装所有必需的python软件包: pip install numpy pip install cv2 pip install tensorflow # tensorflow version 1 is needed pip
2022-01-10 14:44:10 23.2MB hmr omr ctc-loss synthetic-dataset-generation
1