Java,LDA(Latent Dirichlet Allocation)源代码,可以实现分、去除停用功能。
2022-09-19 22:01:17 4.7MB java_lda ldajava mysterious2dn 停用词代码
屏幕取源代码,追踪鼠标,实现屏幕取,利用GetWord v3.3库,可实现在excel、word上取
2022-09-19 16:46:04 40.73MB 鼠标屏幕取词
1
利用金山霸控件XdictGrb.dll实现的屏幕取软件源码
2022-09-19 11:21:11 153KB c# XdictGrb
1
当前,大部分中文预训练模型都是以字为基本单位的,也就是说中文语句会被拆分为一个个字。中文也有一些多颗粒度的语言模型,比如创新工场的ZEN和字节跳动的AMBERT,但这类模型的基本单位还是字,只不过想办
2022-09-19 09:00:27 103KB 技术
1
由于做一个小项目,需要录入信息,考虑到项目里有几个使用五笔的老姑娘会打五笔,在Win10下,因为五笔的问题竟然苦恼了很久,要么有广告,在么用起来不顺手,要么悄悄往后台送数据,要么打不出来生辟字,要么遇到不会拆字根卡在原地,要么Word中经常出夭娥子,简直苦不堪言。没有办法,只能自己亲自下厨,编译封装了这个输入法,具备如下常用特征:1、五笔拼音混录,2、可以打组及语句,3、可以从已录入的字自动造,最长可以长到10个字,这对高频出现的单位名单等极爽,4、真的没有广告,不往后台悄悄发送数据,不用保护好自己的库位置,真的不用担心别人会分析你的小秘密,嗯,会越用越顺手的,越用越爽的。 不足之处:嗯,暂时还没有发现,只发现很爽。
2022-09-12 19:04:47 28.86MB 五笔输入法 没广告 自动造词 语句录入
1
近义、同义中文库,月5.5万个,可用于文章、句子中的同义替换等需求。
2022-09-09 11:11:51 954KB 同义词词库 近义词词库
1
多线程百度下拉采集源码
2022-09-07 16:19:47 1.09MB 网络相关源码
1
包含表: 诗人 poet :13,136条:、2.25 MB 诗歌的解析 appreciation:5214条、23.5 MB 诗歌 poetry:2900008条、105 MB 总体而言诗歌的数量还是比较全的。解析也比较多,格式为"

XX

"这种的。当然没有西窗烛的那个数据库全,那个太牛逼了。 相对而言比较不错。我花钱买的,现在就给大家下载,反正也是他抓取的。嘿嘿
2022-09-05 09:04:29 38.65MB 诗歌 唐诗三百首 宋词 楚辞
1
Xilinx FPGA-嵌入式非特定人孤立语音识别系统的设计与实现
2022-09-03 20:14:22 6.39MB Xilinx
1
英语单(恋恋有123)
2022-09-02 09:01:06 149.47MB python
1