跑胡子java源码光学化学结构识别
-
基准
该存储库包含与公开可用的
OCSR
工具的基准研究相关的信息
材料和方法
为了比较三个可用的开源
OCSR
工具
Imago(2.0
版)、MolVec(0.9.7
版)和
OSRA(2.1.0
版)的结果,根据验证分析了多个在线免费提供的数据集OSRA
开发人员的程序
(4)。
数据集是::
从
OSRA
在线网站
(4)
获得的一组
5719
张化学结构图像和相应的
molfiles(基于来自
USPTO
的数据)。
由英国伯明翰大学开发并与
MolRec
(6)
一起发布的
5740
张图像和化学结构分子文件的数据集
(UOB)。
评估论坛会议和实验室
(CLEF)
测试集,包含
2012
年发布的
961
个图像和
molfiles
(7)。
ChemInfty
发布的数据集的子集(450
个图像和
SD
文件)(见上文),基于日本专利局
(JPO)
的数据,从
OSRA
在线展示
(4)
获得。
(请注意,此数据集包含许多标签(有时带有日文字符)和不规则特征,例如线条粗细的变化。此外,有些图像质量较差,包含大量噪声。)
TIFF
2024-06-10 13:14:50
59.48MB
系统开源
1