开源_易语言中文分词_非网页调用

上传者: tangshangkui | 上传时间: 2021-05-11 06:07:19 | 文件大小: 3.13MB | 文件类型: RAR
' ' 窗口启动的时候,初始化类会把数据库载入内存,以增加运算速度,所以占用内存稍微大一点,如果不喜欢,可以修改类初始化部分{方初始化()} ' 子重置词典数据库() 这个功能用于自定义词库,吧文本词库转换为sqlite数据库词库 ' 词库文件保存在运行目录kic.txt ' 词库数据库为disk.db ' 词库数据保存在sqlite数据库中,没有找到更好的,更快的查找文本的方式,只能先用数据库了 在 子重置词典数据库(),和 方初始化() 这两个方法(函数)中有一定的信息框的错误提示,实际应用最好改成其他提示方式,而且提示错误后程序并不会终止,需要主程序自己判断 词库比较小,分词精度估计不高大,建议实际应用的时候才用更大,跟完整的词库,最好根据内容的相关性这样最好. 提供一个我自己用的词库,主要用于购物网站的分词的,在程序文件夹得kic1.txt里面 修改成kic.txt 然后重新生成数据库就行了 ' 此文件算法根据织梦中文分词php版本的简化版本修改而来,如果用于商业请自行考虑版权问题 '关键字自动获取php源码 这个文件夹里面的就是原来的php文件,应该是老版本的织梦cms里面提取出来的....这是一个简化版本的分词程序 .简化了一些算法,我也是根据这个php文件修改而来的.所以这个分词算法用于提权关键字是比较合适的 .用于更高的要求估计还不够合适 .sqlite采用的是kyozy的sqlite模块,因为他的模块可以吧数据库读入内存... .程序中还有许多可以提升速度的地方....比如说使用的数据库感觉应该有很好的方法...但是没有找到 .欢迎大家指正..做的更好 ' 作者: www.liuxingou.com 十年一剑

文件下载

资源详情

[{"title":"( 17 个子文件 3.13MB ) 开源_易语言中文分词_非网页调用","children":[{"title":"中文分词","children":[{"title":"sqlite3.dll <span style='color:#111;'> 532.00KB </span>","children":null,"spread":false},{"title":"RegEx.fnr <span style='color:#111;'> 212.00KB </span>","children":null,"spread":false},{"title":"SQLite3数据库类.ec <span style='color:#111;'> 60.12KB </span>","children":null,"spread":false},{"title":"主程序.e <span style='color:#111;'> 63.04KB </span>","children":null,"spread":false},{"title":"特别说明.txt <span style='color:#111;'> 1.78KB </span>","children":null,"spread":false},{"title":"commobj.fne <span style='color:#111;'> 112.00KB </span>","children":null,"spread":false},{"title":"krnln.fnr <span style='color:#111;'> 1.04MB </span>","children":null,"spread":false},{"title":"disk.db <span style='color:#111;'> 1.07MB </span>","children":null,"spread":false},{"title":"中文分词测试.exe <span style='color:#111;'> 76.50KB </span>","children":null,"spread":false},{"title":"spec.fne <span style='color:#111;'> 88.00KB </span>","children":null,"spread":false},{"title":"关键字自动获取php源码","children":[{"title":"enews.php <span style='color:#111;'> 24.05KB </span>","children":null,"spread":false},{"title":"Keyword","children":[{"title":"splitword.class.php <span style='color:#111;'> 37.21KB </span>","children":null,"spread":false},{"title":"dede_wwwdic.csv <span style='color:#111;'> 308.71KB </span>","children":null,"spread":false},{"title":"pub_splitword_www.php <span style='color:#111;'> 17.52KB </span>","children":null,"spread":false}],"spread":true},{"title":"enews原始.php <span style='color:#111;'> 22.03KB </span>","children":null,"spread":false}],"spread":true},{"title":"kic1.txt <span style='color:#111;'> 4.49MB </span>","children":null,"spread":false},{"title":"kic.txt <span style='color:#111;'> 339.02KB </span>","children":null,"spread":false}],"spread":false}],"spread":true}]

评论信息

  • 印象ing :
    思路可以借鉴
    2018-06-04
  • ovo555 :
    可以用貌似是织梦的分词系统!
    2018-03-29
  • xpc2011 :
    还不错,搜索速度快,主要优点是断网也能使用,返回的结果比较满意
    2015-09-13
  • w568w :
    最新消息,此源码已失效
    2015-08-08
  • ||一见生财|| :
    正在开发语音控制的智能管家,希望分词能有用
    2015-06-29
  • 飞_雨 :
    谢谢分享,可以用的资源
    2014-12-21
  • qq_21282955 :
    数据库分词 还不错,库资料可以更新,可以虚心
    2014-10-08
  • _luna :
    多谢分享,菜鸟学习了
    2014-01-02

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明