Real_Time_DataMining_Sortware 一款能实时进行文本挖掘的软件,不占用多余的存储空间,直接将采集后的数据集中存储在本地txt中,运用本软件无需进行大量的手动翻页操作,输入对应的店铺链接即可对民宿进行分析包含接结构化数据的可视化和非结构化UGC的情感分析,包含数据的实时采集/数据清洗/结构化保存/UGC数据主题提取/情感分析/后结构化可视化等技术的综合性演示demo。基于在线民宿UGC数据的意见挖掘项目,包含数据挖掘和NLP相关的处理,负责数据采集、整句切分、主题抽取、情感分析等任务。主要克服用户打分和评论不一致,实时对携程和美团在线民宿的满意度进行评测以及对额外数据进行可视化的综合性工具,多维度的对在线UGC进行数据挖掘并可视化,对比顾客直接打分的结果来看,运用机器学习的情感分析方法更能挖掘到详细的顾客意见和对应的合理评分。 软件包含数据采集(txt_analys
2023-03-18 01:22:15 1.86MB nlp demo sentiment-analysis data-spider
1
数据挖掘(有时称为知识发现)是从不同角度分析数据并将其总结为有用信息的过程。 数据挖掘技术用于医学领域的各种用途。 该技术主要用于从数据集中预测疾病。 在本文中,我们将结合各种论文的结果来分析心脏病的最佳有效率。 各种心脏病患者的数据集用于这项研究工作。 本调查论文使用的各种数据挖掘技术是分类、聚类、模糊系统和关联规则来预测心脏病。 通过使用数据挖掘技术,在医学领域,可以在更短的时间内更准确地预测和检测疾病。
2022-12-17 17:25:00 301KB Datamining Prediction
1
rabbit-datamining hello github,OYeah! 创建这个git repository的初始目的是,记录本人在做毕设期间开发的一个data mining项目。 作为一个即将进入社会的计算机研究生,不管任何时候都是在不停的学习的,所以这里也创建了一个记录我的学习历程的工程项目"rabbit-thinkInJava"。里面包括:我在学习某个知识点时的想法和做的实验;但随之而来的毕业季面临着漫长的找工作过程,因此里面还包含了我做过的一些算法题目的解题过程和代码。 待续......
2022-10-28 23:13:43 6.84MB Java
1
k-means聚类算法及matlab代码 项目名称:数据挖掘课作业 项目组成 1. exp1 实验一 《多源数据集成、清洗和统计》 题目 广州大学某班有同学100人,现要从两个数据源汇总学生数据。第一个数据源在数据库中,第二个数据源在txt文件中,两个数据源课程存在缺失、冗余和不一致性,请用C/C++/Java程序实现对两个数据源的一致性合并以及每个学生样本的数值量化。 两个数据源合并后读入内存,并统计: 学生中家乡在Beijing的所有课程的平均成绩。 学生中家乡在广州,课程1在80分以上,且课程9在9分以上的男同学的数量。(备注:该处做了修正,课程10数据为空,更改为课程9) 比较广州和上海两地女生的平均体能测试成绩,哪个地区的更强些? 学习成绩和体能测试成绩,两者的相关性是多少?(九门课的成绩分别与体能成绩计算相关性) 实验一__目录结构 --data1.xlsx 插入数据库的原始数据 --data2.txt 从文件读入的原始数据 --data3.csv 清洗完毕的数据 --data4.csv 清洗完毕的经过特意处理数据 --insertData.py 插入数据库的完整代码 --
2022-09-16 19:29:47 527KB 系统开源
1
人工智人-家居设计-基于DataMining的智能化、开放化远程教学环境.pdf
2022-07-13 09:04:07 1.89MB 人工智人-家居
状态 您必须以 zip 格式呈现存档,以您的名字和姓氏命名(对于成对,两个名字和两个名字),其中包含: 带有决策树的 Bagging 方法的学习和测试功能的来源 带有决策树的 Adaboost.M1 方法的学习和测试功能的来源 Forest-RI 方法的学习和测试功能的来源 一个或多个允许运行所有这些函数的测试的函数(如为 TP3 提供的 test_tree.m 和 test_forest.m 文件) 对您的代码进行大量注释,以逐步解释它的作用。 渲染 每个方法都位于一个文件夹中。 可以使用训练、测试和预测文件以及启动程序的主文件。 对于每种方法,都可以修改主文件中使用的数据集(更改fileName变量)。 装袋(1.SetClassifier(装袋)) 启动main.m以启动 Bagging。 提升(2.SetClassifier(提升)) 开始adaboostMain.m的Ad
2022-05-26 17:36:11 1.55MB MATLAB
1
目录网盘文件永久链接 1.1 数据挖掘概述 1.1.1 数据挖掘典型的应用场景 1.1.2 数据挖掘概述 1.2 数据挖掘基本流程 1.2.1 数据挖掘模式分类 1.2.2 数据挖掘流程 1.3 数据挖掘开发 1.3.1 数据、属性和度量 1.3.2 数据挖掘开发工具 2.1 行列式及矩阵 2.1.1 行列式 2.1.2 矩阵及其变换 2.2 特征值及奇异值 2.2.1 特征值分解 2.2.2 奇异值分解 2.3 随机事件 2.3.1 随机事件及其概率 2.3.2 离散型随机变量及其分布 2.3.3 连续型随机变量及其分布 2.4 条件概率 2.4.1 随机向量及其分布 2.4.2 条件概率-贝叶斯公式 2.4.3 随机变量的数字特征 2.5 假设检验 2.5.1 大数定律与中心极限定理 2.5.2 样本与抽样分布 2.5.3 参数估计与假设检验 2.6 模型分析 2.6.1 方差分析和回归分析 2.6.2 信息熵与基尼系数 2.7.1 最优化问题 2.7.2 梯度下降法 2.7.3 约束最优化 3.1 Python概述 3.2 基本数据类型 3.2.1 Python基础.....
2022-05-02 14:04:04 331B HCIE BigData DataMining
java8 集合源码分析 数据挖掘十大类经典算法 基于Java8实现。 算法目录 常用的标准数据挖掘算法 包名 目录名 算法名 AssociationAnalysis DataMining_Apriori Apriori-关联规则挖掘算法 AssociationAnalysis DataMining_FPTree FPTree-频繁模式树算法 BaggingAndBoosting DataMining_AdaBoost AdaBoost-装袋提升算法 Classification DataMining_CART CART-分类回归树算法 Classification DataMining_ID3 ID3-决策树分类算法 Classification DataMining_KNN KNN-k最近邻算法工具类 Classification DataMining_NaiveBayes NaiveBayes-朴素贝叶斯算法 Clustering DataMining_BIRCH BIRCH-层次聚类算法 Clustering DataMining_KMeans KMeans-K均值算法 Gra
2022-04-21 23:24:23 281KB 系统开源
1
马氏距离matlab代码Distance_Algorithms_Datamining_Matlab Distance_Algorithms_Datamining_Matlab_Euclidean_Mahalanobis_Cossine_Entropy_Correlation_Covariance 在此代码中,我们具有所有列均为数字的样本数据集,然后计算距离算法。 计算所有行之间的欧几里得距离。 计算所有行之间的Mahalanobis距离。 计算所有列之间的余弦距离。 计算所有列之间的相关距离。 计算所有列之间的协方差距离。 每一列的熵。
2022-04-07 22:06:25 23KB 系统开源
1
《Sentiment Analysis and Opinion Mining》,刘冰2012年的书,M&C出版社出版。没在网上找到过免费的,这书很贵的好不好,30美刀…… 话说我这不涉及侵权吧……
2022-01-05 18:22:40 1.74MB 情感分析 评论挖掘 数据挖掘 DataMining
1