上传者: 42162171
|
上传时间: 2022-01-10 14:44:10
|
文件大小: 23.2MB
|
文件类型: -
使用深度神经网络的光学音乐识别
抽象的
光学音乐识别是一个充满挑战的领域,在许多方面都与光学文本识别类似。 但是,它带来了传统的基于管道的识别系统所面临的许多挑战。 在手写文本识别领域,端到端方法已被证明是优越的。 我们试图将这种方法应用于OMR领域。 具体来说,我们专注于手写音乐识别。 为了解决培训数据的不足,我们开发了一种用于手写音乐的雕刻系统,称为Mashcima。 此雕刻系统成功模仿了CVC-MUSCIMA数据集的样式。 我们在CVC-MUSCIMA数据集的一部分上评估了我们的模型,这种方法似乎很有希望。
论文文本
您可以在阅读整个论文
在新机器上设置
确保已安装所有必需的python软件包:
pip install numpy
pip install cv2
pip install tensorflow # tensorflow version 1 is needed
pip