只为小站
首页
域名查询
文件下载
登录
中文文本
分类实验
中文文本
分类完整流程的简单实现,分词、去停用词、提取特征、计算文档的特征向量、支持向量机训练、测试文档分类,简单实现,其中词频统计、去停用词使用布隆过滤器加速,效果不错
2021-03-09 19:55:13
383KB
文本分类
布隆过滤器
特征向量
1
复旦
中文文本
分类语料库训练集
训练集
2021-03-02 19:04:30
144.1MB
文本分类
1
一种基于逆向匹配算法的
中文文本
分类技术
针对
中文文本
的自动分类问题,提出了一种逆向匹配算法。该算法的基本思路是构造一个带权值的分类主题词表,然后用词表中的关键词在待分类的文档中进行逆向匹配,并统计匹配成功的权值和,以权值和最大者作为分类结果。本算法可以避开中文分词的难点和它对分类结果的影响。理论分析和实验结果表明,该技术分类结果的准确度和时间效率都比较高,其综合性能达到了目前主流技术的水平。
2021-02-22 18:07:26
255KB
文本分类;
逆向匹配算法;
增益权值;
主题词表
1
Python-利用Python实现
中文文本
关键词抽取分别采用TFIDFTextRankWord2Vec词聚类三种方法
利用Python实现
中文文本
关键词抽取,分别采用TF-IDF、TextRank、Word2Vec词聚类三种方法。
2021-02-20 18:25:05
888KB
Python开发-自然语言处理
1
pdf libharu 库应用样例 绘制线 绘制面 绘制
中文文本
vs2008样例,包含以及编译好的libharu 32位库 pdf libharu 库应用样例 绘制线 绘制面 绘制
中文文本
pdf libharu 库应用样例 绘制线 绘制面 绘制
中文文本
pdf libharu 库应用样例 绘制线 绘制面 绘制
中文文本
2021-02-05 13:27:29
2.3MB
pdf
libharu
绘制线面
输出中文文本
1
基于向量空间模型的
中文文本
相似度的研究
在文本聚类中需要衡量
中文文本
之间的相似性。本文首先讨论了文本相似度的概念和常用计算算法,详细介绍了向量空间模型和算法步骤,采用删除去除词表、近义词合并、修改文件长度3中策略对算法进行了改进。最后借助盘古分词组件和搜狗实验室的互联网词库,在Visual Studio 2008环境下使用C#语言对算法进行了实现。使用在CNKI上得到的5个不同领域的500篇学术论文的中文摘要对算法进行了测试,结果表明新算法在误差率方面有较大改善,但运行时间较长。
2021-01-28 02:33:53
1.57MB
文本相似度;
向量空间模型;
分词;
信息处理;
1
基于svm的
中文文本
分类系统
基于内容的文本分类系统,使用libsvm 进行分类。
2020-12-30 15:13:41
40.58MB
svm
文本分类
中文分词
libsvm
1
复旦
中文文本
分类-训练集
本语料库由复旦大学李荣陆提供。训练和测试两个语料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。
2020-01-03 11:24:19
109.68MB
文本分类
1
复旦大学
中文文本
分类数据集-训练+测试
由复旦大学李荣陆提供。answer.rar为测试语料,共9833篇文档;train.rar为训练语料,共9804篇文档,分为20个类别。训练语料和测试语料基本按照1:1的比例来划分。收集工作花费了不少人力和物力,所以请大家在使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。
2019-12-25 11:15:53
103.28MB
数据集
中文语料库
1
中文文本
分类语料(复旦)(完整版)
中文文本
分类语料(复旦)-训练集和测试集 这个链接是训练集,本语料库由复旦大学李荣陆提供。test_corpus为测试语料,共9833篇文档;train_corpus为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大,下载时请耐心等待。
2019-12-21 22:04:21
101.81MB
文本分类
数据集
复旦
中文
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
python爬虫数据可视化分析大作业.zip
CNN卷积神经网络Matlab实现
Plex v7.12电视端app
超大规模集成电路先进光刻理论与应用.pdf
中国地面气候资料日值数据集(V3.0)2010-2019.rar
华为OD机试真题.pdf
2019西门子杯六部十层电梯群控参考程序.zip
雷达信号处理仿真程序(MTI,MTD等)
基于YOLOV5的车牌定位和识别源码.zip
长江流域shp.zip
2021华为芯片研发岗位笔试题
风电场风速及功率数据.zip
android studio课程设计作业PPT+设计文档+可运行源代码+设计思路
上帝之眼和拾荒者.rar
刚萨雷斯《数字图像处理》第四版答案.pdf
最新下载
MCAL配置手册大全英飞凌版(超详细)
算法设计与分析期末试卷1.pdf(含答案
kkFileView-4.4.0 源码编译包包含Windows和Linux两个版本
魔签二开的最新超级签名系统.zip
FairyGUI-cocoscreator:Cocos Creator 的灵活 UI 框架-源码
网络攻防技术与实践_诸葛建伟_课程PPT
prony 工具箱(in matlab)
城市规划GIS技术应用指南_随书练习数据
RGSSAD纸老虎系统
易语言IP修改器
其他资源
linux下多定时器+线程池的实现(经典)
福州大学地图学考研复试资料(试题集)(很重要).zip
计算机图形学openGL(中英文第三版)附源码
详解python实现FP-TREE进行关联规则挖掘
android简单的画图板实现代码
FME 序列号生成器 三种生成器 总有一个是你需要的
研究生日常管理系统实验报告
毕业设计智能灯
PCA结合马氏距离 py代码
蓝桥杯练习系统vip题目和测试数据
FiddlerCoreAPI 2019官方最新安装包,demo以及帮助文档
数字信号处理及其matlab实现.pdf
Qt通过控件控制立方体旋转
LPC1857开发板FLASH RTC LCD watchDog ucos示例程序工程源码.zip
matlab-vbnet.rar
分治算法源程序
500强电话销售技巧
音乐播放器的实现
transmission-web-control-1.6.0-beta2
平差课程设计
mindnode 2.5.7,不闪退
stm32f103c8移植ucosII
asp旅行网网站(完整版源码)
JSP 图书管理系统