cn_sort
按拼音和笔顺精确、快速排序大量简体中文词组(支持百万数量级,简体中文与非中文混用的词组也可),有效解决多音字混排的问题。
依赖
运行python版本:
3.6+
本项目涉及以下依赖:
jieba
pypinyin
安装
pip安装命令:
pip install cn_sort --upgrade
如果提示缺少依赖,运行以下命令:
pip install -r requirements.txt
使用
入门
基本用法如下:
from cn_sort.process_cn_word import *
if __name__ == "__main__":
# 先按拼音,再按笔顺排序
text_list = ["重心", "河水", "重庆", "河流", "WTO世贸组织"] # 待排序的中文词组列表
a = list(sort_text_list(tex
1