自动短语:从大量文本语料库中自动进行短语挖掘
刊物
如果您使用的是我们的工具,请引用以下两篇论文。 谢谢!
尚静波,刘加禄,姜萌,任翔,Clare R Voss,韩佳玮,“”,被IEEE Transactions on Knowledge and Data Engineering,2018年2月接受。
刘加鲁*,尚静波*,王驰,任翔和韩佳伟,“”,2015年ACM SIGMOD国际数据管理大会(SIGMOD'15),澳大利亚墨尔本,2015年5月。(*同样贡献, )
近期变动
2020.06.14
用git master更新docker镜像
2018.03.04
修复了预处理和后处理过程中的一些错误,即Tokeninzer.java 。 以前,当语料库包含/之类的字符时,结果可能是错误的,或者可能发生错误。
当短语分段提供新文本时,对于知识库( wiki_quality.txt
1