txt 用于各种单词软件导入 doc 用于单词卡片类学习,包含完整版
2021-08-03 09:41:09 27KB time1000
1
根据Vicon日英词典(Vicon Japanese English Dictionary)制作的日语词条库,包含10.3万余词条。可用作日语词频统计、文本数据挖掘的分词词库。
2021-07-31 15:13:44 16.36MB 日语 词条 分词 词频
1
百度百科约500万条词条,可用于语义关联或简单的知识网络建立,xml格式,解压后638M,请不要用记事本直接打开,我是用UE打开的,sublime好像会有乱码,文件内容示例如下: =1 <TITLE>=百度百科 =百度,百度百科,网络,百科全书,百科词典 =百度知道;贴吧;百度空间;百度地图;百度新闻搜索;百度图片;百度mp3;百度Hi;百度工具栏;百度影视;百度邮编搜索;百度黄页搜索;百度杀毒;百度语音搜索;科利尔百科全书;苏联大百科全书;汇吃百科;维基百科;百度视频;百度蜘蛛;百度文库;互动百科;百度文档;百度文化共享搜索;百度盲道;百度会员;百度搜藏;百度TV;百科全书;知识掌门人;百度游戏;百度有啊;张震;科友; =http://baike.baidu.com/view/1.htm =2 <TITLE>=词条 =百度,百度百科 =相关词条; =http://baike.baidu.com/view/2.htm =3 <TITLE>=编辑实验 =百度,百度百科,帮助,词条,编辑 =词条;百度; =http://baike.baidu.com/view/3.htm =4 <TITLE>=馒头 =食品,饮食,面食,食谱,蒸馍 =大饼;油条;面包;饺子;花卷;包子;麻花;食品;主食;糯米饭;蛋糕;鲜肉包;米粥;面条;凉拌菜;年糕;饼干;窝头;粽子;烤饼;酥饼;汤圆;烧饼; =http://baike.baidu.com/view/4.htm =6 <TITLE>=雁荡山 =地理,旅游,旅游景点,自然景观,地质公园 =华山;泰山;普陀山;恒山;嵩山;莫干山;浣江;衡山;括苍山;双龙洞;雪窦山;天台山;天目山;楠溪江;天柱山;景宁香炉山;乌镇;杭州西湖;泽雅;白水洋;武夷山;洞宫山;桃花岛;三清山;黄山;新安江水库;崂山区;溪口;太姥山;南麂列岛;野鹤湫;庐山;江心屿;瑶溪;朱家尖;石桅岩;绍兴县;杨家溪;仙岩山;仙都风景区;大龙湫;三折瀑;五岳; =http://baike.baidu.com/view/6.htm =7 <TITLE>=灵峰 =风景,雁荡山,地理,旅游,温州 = =http://baike.baidu.com/view/7.htm
2021-07-28 11:01:18 103.28MB 百科 知识库
1
睿信电子语音识别模块资料,包含主控芯片例程,识别词条生成工具,测试工程等等
2021-07-11 13:00:42 9.68MB 语音模块 词条生成工具 语音转换
1
爬取搜狗 2020-3-23 的所有字条,700 多 w 条。只有 txt,可用于 Elasticsearch 词库扩展。都在一个文件中,我已去重
2021-06-13 15:41:57 108.9MB 搜狗词条 ik 中文分词器词库
1
淘宝Top20W词条
2021-05-30 13:01:16 6.94MB 淘宝词条 top20W
1
入门级爬虫,爬取百度百科词条和简介
2021-03-21 16:22:26 137KB Python开发-Web爬虫
1
个人爬虫获取的截至到2020年7月份的百度词条,仅仅是词条名。全部共1700多万个词条名。可用于中文自然语言处理。txt格式
2021-03-01 09:59:41 141.46MB 百度词条
1
包含伪原创词库英文42080词库,伪原创词库汉语42536条
2021-02-18 23:52:42 452KB 伪原创词库 伪原创词条 英文为原创
1
这篇文档就是解密百度百科之“企业词条”创建的那些不为人知的问题,并且我将抛开各种繁琐的“大道理”和“无用的知识点”,通过简单直接的“核心秘密”让大家看完后很快就能轻松的创建各种类型的百度百科企业词条,从此以后不用再花钱求别人了。
2021-02-03 23:39:51 4.23MB 百度百科 百科创建 百科营销 百科词条