数据分析与知识发现期刊论文MWEC:一种基于多语义词向量的中文新词发现方法,论文支撑数据,包括: [1] 张乐,冷基栋,袁梦龙. Newworddiscovery_data.zip. 新浪产经、搜狐体育、马蜂窝旅游和网易云音乐网络文本数据121.9M [2] 张乐,冷基栋,袁梦龙. Random2000.zip. 新浪产经、搜狐体育、马蜂窝旅游和网易云音乐四个领域分别随机选取的2000条网络文本数据 [3] 张乐,冷基栋,袁梦龙. annotations.zip. 新浪产经、搜狐体育、马蜂窝旅游和网易云音乐四个领域分别随机选取的2000条网络文本数据的人工标注结果
2022-02-15 19:55:18 60.96MB MWEC 数据分析与知识发现
1
云计算将软件架构于低端小型机/高端X86服务器及中低端存储之上,有利于采购标准化,降低硬件成本。
2022-02-15 10:27:35 1.65MB 技术前沿
1
2021 适应新型电力系统的储能等电力电子化设备主动支撑技术探索与实践.pdf
2022-01-30 09:06:35 4.93MB 安全 新型电力系统 储能 研究报告
支撑梁拆除施工方案终版.docx
2022-01-29 09:09:31 25KB 网络文档
钢铁:原料提涨支撑钢价,冬储渐进尾声.pdf
2022-01-24 17:02:08 3.05MB 行业报告 行业分析 数据分析 专业指导
玻纤周观点:粗纱价格有支撑,电子布纱价格本周继续回落.pdf
2022-01-24 17:02:05 1.14MB 行业报告 行业分析 数据分析 专业指导
某县科技支撑巨桉推广建设项目简介.docx
2022-01-24 14:12:09 34KB word文档 管理类文档
高支模支撑系统专项安全施工方案.doc
2022-01-13 21:02:37 557KB 教育教学
卸荷支撑及梁底加固专项措施施工方案(20220105223637).docx
1
大数据至少具备以下三个特性:数据量巨大(volume),处理速度要求快(velocity),数据类型复杂繁多(variety)针对上面的三个特性,现在对volume与velocity的研究较多,而对 Variety的研究相对较少。 在Variety的研究上主要是使用度量空间来表示,,其具备高度的普遍适用性,但是在度量空间中没有坐标信息,很多平时使用的数学工具无法使用,因此需要对其度量空间内的数据进行坐标化,这样,即可实现传统的数学计算,例如计算距离,计算垂直平分线等等。而数据的坐标化依赖于支撑点的选取。因此支撑点对于度量空间模型中的数据管理和数据分析至关重要。 现在支撑点的选取有三大类问题: 1.支撑点的目标函数2.度量空间需要的支撑点数量 3.实现支撑点选择的算法,考虑其性能与数目,(在合理的时间和空间达到最优的算法的重要性显而易见) 本论文主要针对以上三个支撑点选取的方向进行研究,并且在三大类问题提出新的思路: (1) 提出基于半径新的目标函数,用于度量空间索引时支撑点的选取 (2) 提出基于坐标矩阵的特征值确定支撑点数目的新方法,性能与以往相同,计算时间简单 (3) 提出抽样支撑点选择框架 其各自的重要性,当前研究情况,当前研究存在的问题,论文的方法和创新点,实验证实后 面会针对三者分别列出。因此需要对测试数据集进行说明
2022-01-05 10:26:24 556KB 课程论文作业
1