20210516-东吴证券-阿里巴巴~SW-9988.HK-电商领域竞争加剧,大规模投入拖累公司业绩表现.pdf
2021-05-17 10:03:55 663KB 行业咨询
大规模Scrum:大规模敏捷组织的设计》_肖冰译_2018-08-01.pdf
2021-05-16 23:01:26 161.92MB Scrum
1
传统的话题发现研究主要针对于长文本及新闻数据集,大规模短文本具有稀疏、无结构、多噪等特点,传统方法很难有效发现话题。提出了一个融合词共现与加权GN(CW-WGN)算法的快速话题发现方法,描述了CW-WGN方法的详细过程,给出方法的具体算法。采集了sina微博、新闻网站的标题真实的短文本数据,构建了基础测试数据集,采用LDA与K-means方法作为对比进行了大量对比实验。实验结果表明CW-WGN比LDA和K-means方法能够多发现20%以上的正确话题,而且发现的话题纯度也高于LDA与K-means。此外,CW-WGN消耗的时间最少,能够有效地从实际大规模短文本上发现话题。
2021-05-14 11:45:33 1.99MB 短文本 话题发现 词共现 社团发现
1
SYSU-ForeSee ForeSee是基于大规模商业情报融合的企业智能实时分析及决策支持平台项目,提供包括前框架,数据挖掘内部的全栈解决方案。 欢迎访问平台以查看案例展示。 1. ForeSee_FrontEnd 前端模块基于 ( )和 ( )开源框架开发。 2. ForeSee_BackEnd 初步模块基于 ( ), , ,
2021-05-13 23:49:24 197.3MB Python
1
博主不定期更新【保研/推免、C/C++、5G移动通信、Linux、生活随笔】系列文章,喜欢的朋友【点赞+关注】支持一下吧! 本系列文章均摘录自《大规模MIMO传输理论与关键技术》! Chapter 2 大规模MIMO系统信息论基础及信道容量分析 2.1 大规模MIMO系统信息论基础 2.1.1 MIMO技术 MIMO技术的主要特色是在发送端和接收端均采用多天线单元完成信息的发送与接收,下图给出了基本的MIMO系统框图。图中发射机与接收机均配置多个天线,信号编码后由发射机的多个天线独立发送,接收端用多个天线接收并通过解调、检测等过程来恢复原始的发送信号。 在MIMO传输技术中,如果发送端或
2021-05-13 09:25:05 349KB 4g基站 apt mimo
1
使用NVIDIA CUDA的“阴阳” K均值和K-nn K均值的实现基于 。 尽管它引入了一些开销和许多对CUDA不利的条件子句,但与Lloyd算法相比,它仍然显示出1.6到2倍的加速。 K近邻采用相同的三角形不等式思想,并且需要预先计算的质心和聚类分配,类似于展平的球树。 sklearn KMeans KMeansRex KMeansRex OpenMP 塞班 克库达 kmcuda 2 GPU 速度 1倍 4.5倍 8.2倍 15.5倍 17.8倍 29.8倍 记忆 1倍 2倍 2倍 0.6倍 0.6倍 0.6倍 从技术上讲,该项目是一个共享库,可导出kmcuda.h定义的两个函数: kmeans_cuda和knn_cuda 。 它具有内置的Python3和R本机扩展支持,因此您可以from libKMCUDA import kmeans_cuda或dyn.load("libKMCUDA.so") 。 目录 K均值 该项目与其他项目之间的主要区别在于,kmcuda已针对内存消耗低和大量群集进行了优化。 例如,kmcuda可以将480个维度中的4M个样本分类为40000个
2021-05-12 19:32:49 423KB python machine-learning cuda knn-search
1
为了提升传统多视图K-means算法在高维数据中的聚类性能,提出了一种鲁棒性大规模多视图数据的自降维K-means算法RMSKMC(robust multi-view subKmeans clustering)。通过寻找单个视图上的最优子空间实现高维数据的自降维,利用非负矩阵分解(NMF)对损失函数进行重构,使不同视图共享相同的聚类指示矩阵从而实现多视图信息互补,完成大规模多视图数据的聚类。实验结果表明,在大规模多视图数据集上,该算法比其他多视图聚类算法资源消耗更小,并且能够进行更为准确的聚类。
2021-04-30 17:02:57 1.18MB 大规模数据 多视图 自降维
1
随着互联网、社交网络、云计算、物联网、移动计算、大规模科学探测与计算分析等的发展,各种新的数据密集型应用如雨后春笋般涌现。这些新的应用通常具有数据量巨大、数据获取速度更新速度快和/或数据种类丰富繁多等特点,被通称为大数据应用。近年来,产业界和学术界面向不同应用场景推出了多种类型、各具特色的大数据处理系统平台。同时,一大批数据建模与分析的方法被应用于大规模数据处理。一方面,多种大数据处理平台没有统一的标准,设计目标、功能和关键技术也多有不同,对于初学者的学习带来了很大的困难,容易“只见树木不见森林”,难以形成全面的认识。另一方面,大规模数据处理要求选择恰当的算法,适合的大数据平台,才能达到其功能和性能的目标。
2021-04-29 21:19:14 30.69MB 国科大 大数据
1
大规模MIMO综述论文,总结了点对点,单小区多用户,多小区多用户情景下小区通信性能的综述。
2021-04-28 21:15:03 837KB 大规模MIMO
1
为了提高混合连接的混合预编码的频谱效率,首先利用连续干扰消除(SIC)的原理得到理想条件下的最优混合预编码矩阵,然后利用梯度下降理论将最优混合预编码矩阵分解为数字预编码矩阵和模拟预编码矩阵,最后考虑模拟预编码矩阵的恒模约束条件,并以最大化频谱效率为目标利用交替最小化方法优化模拟和数字预编码矩阵。所提出的混合预编码设计算法基于混合连接结构,因而能量效率远优于部分连接的和全连接的混合预编码。同时,该算法不会增加混合连接的混合预编码的硬件复杂度且只少量增加计算量。仿真结果表明,该算法能提升混合连接的混合预编码的频谱效率,特别是当射频(RF)链路数大于数据流数时,频谱效率的提升更加显著。由于分块不需要满足正交性,该算法比现有混合连接的混合预编码更适合实际应用。
1