BanglaNotepad:集成了AI的智能记事本,可识别孟加拉语手写体
这是一个正在建设中的项目。
字符识别
当前,这是已启动项目的唯一方面。 它可以识别(大约90-95%-ish精度)单个孟加拉语字母和数字(以及精度降低的特殊混合字母)。
训练数据集
对于数字,我使用了数据集。 对于字母(和特殊的混合字母),我使用了集集。 不幸的是,并不是所有特殊的混合字符都包含在这些数据集中,即使覆盖了所有特殊混合字符,受过训练的模型也不如预期的那样准确,仅仅是因为混合字符往往看起来像它们的父字符一样。 混合字符识别可能需要某种堆叠模型。 训练之前先处理数据。 sigmod功能与适当的参数一起使用可减少图像噪音并突出显示笔触。 注意:此存储库中不包含数据集(感谢您阻止我的100MB以上推送,Github :expressionless_face: )
模型
到目前为止,该模型已经在Tensorflow下使用Keras进行了训练,使用2隐
1