使用深度神经网络的离线数学公式识别
基于。
要求
的Python 3
可以使用PIP安装所有依赖项。
pip install -r requirements.txt
如果您想在PyTorch中使用其他安装方法或其他CUDA版本(例如CUDA 10),请按照的说明进行。
数据
。 因为它是一个在线手写数据集,所以它由InkML文件组成,但是此体系结构用于离线识别,这意味着将图像用作输入。
数据集已转换为大小为256x256图像,并且还提取了地面真实情况。 转换后的数据集可以在。
数据需要在data/目录中,并且tokens.tsv文件定义了可用制表符,这些制表符由制表符分隔。 训练和验证集在gt_split/train.tsv和gt_split/validation.tsv中定义,其中每行是图像及其基本事实的路径。
可以通过运行以下命令来生成训练/验证拆分:
python dat
1