适用于中文中长文本分类 原始数据集和已经划分的数据集已给出 划分的数据集经过数据预处理,删除了其中的重复文本,以及文本长度小于50的句子,最终构造的平衡语料 训练集 5800 测试集 1000条 验证集1000 (正负评论各站一半)
1
基于Spark的分布式大数据分析算法研究
2023-01-15 03:16:25 422KB 研究论文
1
In this practical and comprehensive guide, author Martin Kleppmann helps you navigate this diverse landscape by examining the pros and cons of various technologies for processing and storing data. Software keeps changing, but the fundamental principles remain the same. With this book, software engineers and architects will learn how to apply those ideas in practice, and how to make full use of data in modern applications.
2023-01-14 00:44:44 15.76MB 大数据 分布式 架构设计 系统设计
1
我们都知道对大规模数据进行复杂的数据分析通常需要耗费大量的时间,这时就需要我们的数据消减技术了。 数据消减技术的主要目的就是从原有巨大数据集中获得一个精简的数据集,并使这一精简数据集保持原有数据集的完整性。这样在精简数据集上进行数据挖掘就会提高效率,并且能够保证挖掘出来的结果与使用原有数据集所获得的结果基本相同。 数据消减的主要策略有以下几种。 名称 说明 数据立方合计 这类合计操作主要用于构造数据立方(数据仓库操作)。 维数消减 主要用于检测和消除无关、弱相关,或冗余的属性或维(数据仓库中属性)。 数据压缩 利用编码技术压缩数据集的大小。 数据块消
2023-01-12 19:24:19 189KB 大数据 层次模型 数据
1
DAC8760完全资料含STM32驱动源码.docxDAC8760完全资料含STM32驱动源码.docx
2023-01-12 16:04:22 1.5MB 互联网
人工智能 大数据时代机器学习的新趋势 大数据 新趋势 机器学习
2023-01-12 15:18:27 215KB 大数据 机器学习
1
本科毕业论文设计 题 目嵌入式公交汉字显示系统的设计与实现 摘要 随着时代的进步公交车已经成为我们学生族和工薪族出门必须的交通工具由于单片机技术以及嵌入式技术飞速发展目前在公交车报站方面也由传统的人工报站逐渐改变为使用微电脑控制的语音文字报站系统从以前售票员的大声报站变成现在的自动语音报站以及汉字提示等新型的报站系统加快了现代化建设的进程 本文介绍了一种新型的嵌入式公交车汉字显示系统的设计原理同
2023-01-11 18:53:21 2.24MB 文档 互联网 资源
1
包括全国各类公园的名称,地址信息,位置坐标,营业时间,所归属的城市等信息
2023-01-11 17:15:00 1.47MB 全国公园 实时大数据
1
互联网大数据产品对比、比较
2023-01-11 12:55:54 18KB 互联网大数据产品对比
1
开源大数据平台总设、架构设计
2023-01-11 12:52:31 3.77MB 开源大数据平台总设
1