Real_Time_DataMining_Sortware 一款能实时进行文本挖掘的软件,不占用多余的存储空间,直接将采集后的数据集中存储在本地txt中,运用本软件无需进行大量的手动翻页操作,输入对应的店铺链接即可对民宿进行分析包含接结构化数据的可视化和非结构化UGC的情感分析,包含数据的实时采集/数据清洗/结构化保存/UGC数据主题提取/情感分析/后结构化可视化等技术的综合性演示demo。基于在线民宿UGC数据的意见挖掘项目,包含数据挖掘和NLP相关的处理,负责数据采集、整句切分、主题抽取、情感分析等任务。主要克服用户打分和评论不一致,实时对携程和美团在线民宿的满意度进行评测以及对额外数据进行可视化的综合性工具,多维度的对在线UGC进行数据挖掘并可视化,对比顾客直接打分的结果来看,运用机器学习的情感分析方法更能挖掘到详细的顾客意见和对应的合理评分。 软件包含数据采集(txt_analys
2023-03-18 01:22:15 1.86MB nlp demo sentiment-analysis data-spider
1
使用Python可视化气候变化数据 使用xarray和cartopy Python库生成气候变化数据(GISTEMP v4)的图表和动画。
2023-03-17 21:47:51 3.43MB python sustainability xarray climate-data
1
基于不平衡数据的Python_Health-Insurance-交叉销售预测 在该项目中,我们将现代机器学习技术应用于保险单持有人的数据,以分析和预测其行为。 使用Python语言,我们对数据的处理方法产生了令人兴奋的见解,可以帮助保险公司进行业务建模。
2023-03-17 18:20:03 6.05MB JupyterNotebook
1
数据分析项目 1.健康保险交叉销售预测 (Kaggle数据集URL: ://www.kaggle.com/anmolkumar/health-insurance-cross-sell-prediction) 训练数据包含381109笔客户资料,每笔客户资料包含12个细分,1个客户ID细分,10个输入细分及1个目标细分-Response是否响应(1代表关注,0代表不关注)。 初步 角色 测量类型 不同值个数 ID 记录标识 无类型 381109 性别 输入 分类型 2个 年龄 输入 数值型 66 驾驶执照 输入 分类型 2个 区域代码 输入 分类型 53 以前_已保险 输入 分类型 2个 车辆年龄 输入 分类型 3 车辆损坏 输入 分类型 2个 年度_高级 输入 数值型 48838 Policy_Sales_Channel 输入 分类 155 优质的 输入 数值型 290 回
2023-03-17 16:49:16 4.75MB JupyterNotebook
1
ordered-map:保留插入顺序的C ++哈希映射和哈希集
2023-03-16 13:41:30 76KB c-plus-plus cpp hash-map data-structures
1
DoubleML-Python中的双机学习 Python软件包DoubleML提供了的双重/无偏机器学习框架的 。 它建立在(Pedregosa等,2011)。 请注意,Python软件包是与基于的R twin一起开发的。 R包也可以在和 。 文档和维护 文档和网站: : DoubleML当前由和维护。 可以将错误报告给问题跟踪器,为 。 主要特点 双重/无偏机器学习 部分线性回归模型(PLR) 部分线性IV回归模型(PLIV) 互动回归模型(IRM) 交互式IV回归模型(IIVM) DoubleML的面向对象的实现非常灵活。 模型类DoubleMLPLR , Doub
2023-03-15 23:00:41 207KB python data-science machine-learning statistics
1
The IMX264LQR-C is a diagonal 11.1 mm(Type 2/3) CMOS active pixel type solid-state image sensor with a square pixel array and 5.07 M effective pixels. This chip features a global shutter with variable charge-integration time. This chip operates with analog 3.3 V, digital 1.2 V, and interface 1.8 V triple power supply, and has low power consumption. High sensitivity, low dark current and low PLS characteristics are achieved. (Applications: FA cameras, ITS cameras)
2023-03-15 14:35:48 1.35MB IMX264L
1
由于癌症,许多人的生命被缩短。但是,由于大数据时代的到来,我们能够抗击这种恶意疾病。 cancer patient data sets.xlsx
2023-03-14 21:58:26 68KB 数据集
1
Storytelling with Data A Data Cole Nussbaumer KnaflicStorytelling with Data A Data Cole Nussbaumer Knaflic
2023-03-14 12:02:30 6.82MB Storyt
1
Data Mining concepts and techniques
2023-03-14 10:26:15 1.83MB 数据挖掘
1