广告实时竞价数据,是广告牌、商场广告位和互联网广告栏中的广告位的实时竞价情况信息,用以训练有偏模型和预测客户点击。
1
传统的支持向量机(SVM)算法在数据不均衡的情况下,分类效果很不理想。为了提高SVM算法在不均衡数据集下的分类性能,提出随机下采样与SMOTE算法结合的不均衡分类方法。该方法首先利用随机下采样对多数类样本进行采样,去除样本中大量重叠的冗余样本,使得在减少数据的同时保留更多有用信息;而对少数类样本则是利用SMOTE算法进行过采样。实验部分将其应用在UCI数据集中并同其他采样算法比较,结果表明文中算法不但能有效提高SVM算法在不均衡数据中少数类的分类性能,而且总体分类性能也有所提高。
1
Nginx是一个高性能的HTTP和反向代理web服务器,同时也提供了IMAP/POP3/SMTP服务。它具有很多非常优越的特性:在连接高并发的情况下,Nginx是Aoache服务不错的替代品。Nginx相较于 Apache、lighttpd 具有占有内存少,稳定性高等优势,并且Nginx有反向代理、负载均衡和缓存数据的功能。 反向代理:其实客户端对代理是无感知的,因为客户端不需要任何配置就可以访问,我们只需要将请求发送到反向代理服务器,由反向代理服务器去选择目标服务器获取数据后,在返回给客户端,此时反向代理服务器和目标服务器对外就是一个服务器,暴露的是代理服务器地址,隐藏了真实服务器IP地址。 负载均衡:LB是一种集群技术,它将特定的业务(网络服务、网络流量等)分担给多台网络设备(包括服务器、防火墙等)或多条链路,从而提高了业务处理能力,保证了业务的高可靠性。简单来说,就是把多条客户端的请求传给Nginx反向代理服务器,Nginx在把这些请求分别发送而给多个Web服务器,来减少直接对一个Web服务器造成的压力。 缓存数据:数据缓存是客户端第一次访问服务器的时候,nginx会把从服务器返
2022-05-25 16:00:36 585KB nginx 运维
1
大数据-算法-面向不均衡数据和情感词典构建的特征选择方法研究.pdf
2022-05-07 09:08:52 2.3MB 文档资料 big data 算法
大数据-算法-非均衡数据分类算法及其在助学贷款风险管理中的应用研究.pdf
2022-05-03 14:10:22 5.85MB 算法 文档资料 big data
广告实时竞价数据,是广告牌、商场广告位和互联网广告栏中的广告位的实时竞价情况信息,用以训练有偏模型和预测客户点击。
1
传统的分类方法都是建立在类分布大致平衡这一假设基础上的,然而实际情况中,数据往往都是不均衡的。因此,传统分类器分类性能通常比较有限。从数据层面和算法层面对国内外分类算法做了详细而系统的概述。并通过仿真实验,比较了多种不平衡分类算法在6个不同数据集上的分类性能,发现改进的分类算法在整体性能上得到不同程度的提高,最后列出了不均衡数据分类发展还需解决的一些问题。
2021-03-06 16:18:02 1.12MB 不均衡数据; 改进算法; 分类性能
1
针对传统支持向量机(SVM)算法在数据不均衡情况下无法有效实现故障检测的不足,提出一种基于过抽样和代价敏感支持向量机相结合的故障检测新算法。该算法首先利用边界人工少数类过抽样技术(BSMOTE)实现训练样本的均衡。为减少人工增加样本带来的噪声影响,利用K近邻构造一个代价敏感的支持向量机(CSSVM)算法,利用每个样本的代价函数消除噪声样本对SVM算法分类精度的影响。将该算法应用在轴承故障检测中,并同传统的SVM算法,不同类代价敏感SVM-C算法,SVM和SMOTE相结合的算法进行比较,试验结果表明当样本不均衡时,建议算法的故障检测性能较其它算法有显著提高。
1
面对不均衡数据集多分类 两分类的极限学习机源码
2020-01-04 03:15:17 857KB 不均衡数据集 分类
1