基于中文对话文本使用Word2Vec进行训练得到的向量
2021-10-25 12:23:41 10.83MB python word2vec 词向量
1
山东省泰安市小学英语三年级上册期末专题复习:选填空.pdf
2021-10-24 20:03:00 425KB
山东省泰安市小学英语三年级下册期末复习(单拼写与选填空).pdf
2021-10-24 20:02:58 377KB
山东省泰安市英语三年级下册期末复习(单拼写与选填空).pdf
2021-10-24 20:02:55 390KB
山东省济南市2020年英语四年级上册期末专题复习:选填空A卷.pdf
2021-10-24 20:02:49 994KB
识别问题的解决方案主要有两种,一种是基于概率统计的,另一种是基于规则的。本文在两者的基础上,实现统计与规则相结合的新识别检测问题。首先从熟语料中构建N元组候选库,然后对候选库分别进行规则过滤,互信息过滤以及位置成率过滤,再经过N元组重叠标记得到各自不同的新表。最后综合三种方法,实现统计与规则相结合的新识别算法,实验结果表明新识别准确率达到88%。
2021-10-24 16:44:03 924B 汉语自动分词
1
同义林 可用于机器翻译 消除句子歧义 信息检索 数据时txt的 整理的很规则 很好用啊 同义林 可用于机器翻译 消除句子歧义 信息检索 数据时txt的 整理的很规则 很好用啊
1
金山霸生批量导入的工具和操作方法
2021-10-23 15:03:42 9.09MB icba
1
中文 停止 stopwords 中文 停止 stopwords 中文 停止 stopwords
2021-10-23 14:05:49 15KB 中文 停止词 stopwords
1
txt格式,一组同义占一行,多个之间用英文逗号分隔,前后都有逗号。形如:“,后继有人 ,后来居上 ,后来者居上 ,后起之秀 ,略胜一筹 ,棋高一着 ,青出于蓝,”。 注意是9836组,不是9836条,已经归类绝无重复。去除了所有重复的汇及单字,有时间再处理一下把可能产生歧义的汇也去掉就好了,如果有朋友还有其他汇但不会整理归类可以联系我
2021-10-23 11:05:27 232KB 同义词  近义词
1