基于相似度计算的主观题阅卷系统设计,此系统通过ictclas把答案进行分词,然后把分词结果对照中文停用词表把一些没有实际意义的词语过滤掉,然后根据余弦定理计算出学
生答案和标准答案的相似度。句子分词是直接用的中科院的ictclas,其他地方是自己写的,包括分词后每个词的权值啦,去除无意义的词啦(比如:的,像,是,好。。。等等
对照停用词表),最后通过自己的计算公式,计算出学生答案和标准答案的相似度百分比。
可以直接在main方法中测试,不过自己又添加了struts,所以也可以在页面当中进行测试。功能经过自己测试完全通过,至于美化页面,自己有兴趣可以完善一下。
1