中文人名语料库(Chinese-Names-Corpus)
业余项目“萌名NameMoe(一个基于语料库技术的取名工具)”的副产品。
萌名手机网页测试版: ,欢迎体验。
不定期更新。只删词,不加词。
可用于中文分词、人名识别。
请勿将本库打包上传其他网站挣积分,已上传的请配合删除,谢谢!
中文常见人名(Chinese_Names_Corpus)
数据大小:120万。
语料来源:从亿级人名语料中提取。
数据清洗:已清洗,但仍存有少量badcase。
新增人名生成器。
中文古代人名(Ancient_Names_Corpus)
数据大小:25万。
语料来源:多个人名词典汇总。
数据清洗:已清洗。
中文姓氏(Chinese_Family_Name)
数据大小:1千。
语料来源:从亿级人名语料中提取。
数据清洗:已清洗。
中文称呼(Chinese_Relationship)
数据大小:5千,称呼词根
1