自动文章评分 概要 本项目通过文本分析技术实现对文章作文的自动打分,目标是作文集中,采用gbdt模型进行拟合。 ,,加上文章单词数,类别词性的单词数,错别字,句子个数等等,将上述特征串联作为输入,使用gbdt模型拟合目标 依赖 python3 大熊猫 麻木 matplotlib 恩特克 斯克莱恩 word2vec 细绳 实现 1.数据分析 使用boxplot可视化作文分数的分布,如下图: 可以看到在作文类型为1,2,5,6,7,8中有个别的异常值点,这些异常值点需要在文本预先时剔除。 2.训练词向量 利用word2vec对训练样本做词向量的训练,可视化结果如下: 可以看到意思相近的词的距离还是比较近的,例如,总是在开头的when和who,kid和people等等。 3.特征工程 文本特征采用采样的方式,目标是从文章中一共采样200个词向量,均匀间隔采样,不够则从头开始循环采样 文章中
2022-03-01 09:19:45 13.12MB 系统开源
1
程序为Python代码编写,本人为程序配置了详细的博客解析,详见http://blog.csdn.net/bcj296050240/article/details/46686797
2022-02-26 23:16:59 198KB python 情感分析 词典
1
运动会比赛中,有10个评委为5个选手打分(最高分为10分),选手最后得分为:去掉1个最高分和1个最低分后的平均分。 具体实现下面功能: (1)输入5个选手姓名和每个评委的评分 (2)求每个选手平均分(去掉1个最高分和1个最低分) (3)按平均分从高到低分排序 (4)按名次输出。 (5)将本次结果保存起来 (6)要求用户界面尽可能美观友好
2022-02-08 14:28:02 3KB 打分
1
等保二级、等保三级、等保四级权重
1. 根据n个选手的最后得分,从高到低排出名次,以便确定获奖名单。 2. 根据各选手的最后得分与各评委给该选手所评分的差别,给各个评委评分的准确性一个确定的评价,并输出评委的评判水平名次表。 3. 要求在编程过程中,需记下每位选手及评委的编号。 4. 选手信息包括:姓名 性别 年龄 学校。 5. 有一定的菜单界面。 大一C语言课程设计写的代码,打分系统
2021-12-30 11:34:57 4KB C语言的
1
评价:打分函数 每一个对接的算术都会采用平衡了时效和精确度的简单自由能预测方法,现在的打分函数主要包括三种:基于经验的回归参数的方法;基于分子力场的方法和基于知识的方法、基于知识的打分函数 。 *
2021-12-27 22:14:53 1.82MB 分子对接
1
建筑标准设计室打分表.doc
2021-12-26 22:03:37 86KB 资料
Customer_satisfaction_Analysis 结果整合 Demo 演示 基于用户 UGC 的在线民宿满意度挖掘,负责数据采集、主题抽取、情感分析等任务。开发的目的是克服用户打分和评论不一致,实现了在线评论采集和用户满意度分析。 主要功能包括在线原始评论采集、主题聚类、评论情感分析与结果可视化展示等四个模块,如下所示。 提取后的民宿地址和在线评论等信息如下。 搭建了百度地图 POI 查询入口,可以进行自动化的批量查询地理信息。 通过高频词可视化展示,归纳出评论主题。 构建了基于在线民宿语料的 LDA 自动化主题聚类模型,利用主题中心词能找出对应的主题属性字典,并使用用户打分作为标注,然后通过多种分类模型,选用最优模型对提出的评价主体 进行情感分析,针对主题属性表进行主题提取后的文本进行情感分析,分别得出当前主题对应的情感趋势,横坐标为所有关于主题为“环境”的情感得分,纵坐标为
1
本项目立足于近几年出现的一些数据处理和控制集成芯片,将一些语音信号处理的专用算法应用到评分系统中来,以改进现行系统,增强评分的准确性。
2021-12-21 10:17:22 174KB matlab FPGA 语音信号处理 时域比较
1
14.4 基于协同过滤的推荐系统  典型的推荐应用 —公司积累了大量的用户(user)对物品(item)的打分记录。 —根据当前用户的消费喜好,找到与其喜好相似的其他客户,分析他们有哪些物品(item) 对当前用户而言尚未消费使用,将这些物品推荐给当前用户。 —前提:当前访问用户的消费喜好和其他某些用户的消费喜好相似,且这种喜好在 近一段 时间以及未来一段时间内保持稳定。 —这样的推荐系统称为基于协同过滤的推荐系统(Collaborative-based Systems)  基于协同过滤的推荐系统又可分为: —基于用户(user)相似度(临近度)推荐(计算两个用户间的相似度,共同喜好总物品数) —基于物品(item)相似度(临近度)推荐(计算两个物品间的相似度,共同拥有的用户数)  操作步骤 第一步:加载并查看数据 将训练数据“collaborative_train”拖动到操作流程页面,将其连接到系统输出端,点击 运行后,我们看到数据分成三列,分别是“user_id”用户属性,“item_id”物品属性以及“rating” 打分属性,如图 14.1,有 28234 条打分记录,通过观察统计视图,没有发现缺失值。将测试 数据“collaborative_test”同样拖到流程里面来,观察数据,也有同样的属性项。 图 14.1 用户对物品的打分
2021-12-12 16:14:59 6.46MB RapidMiner
1