2019中国高校计算机大赛-大数据挑战赛WriteUp 赛题: 我们是最终排名第15名的改革春风吹满地队伍,对方法和模型进行了简单的整理。 传统模型 查询和标题去重 训练词向量以及词频统计是query和title需做去重处理 图特征 计划生成无向图以及权重图。无向图规模最大建立一亿三千万数据量的图,生成图的过程把query和title都转换成一个Int32的ID值,减少内存消耗。 技巧:利用Pickle保存,读取图是加速的,文件的体积也是最小的。 无向图特征-最大完全子图max_clique :最大完全子图的大小(特征效果提升不明显,舍弃!)。 无向图特征-边连接数max_degrees :统计每个字节的边连接数 无向图特征-最大连通子图规模max_components :统计每个实例最大连通子图规模 无向图特征——pagerank值:根据Google的pagerank算法计算每个节点
2021-10-22 18:30:22 1.17MB JupyterNotebook
1
本项目主要使用了学校、省份、水平层次、办学类别、985、211、双一流、专业名称、国家特色专业等数据,通过pandas相关模块对数据进行抽取、清洗和分组统计计算,再而用pyecharts数据可视化模块绘制交互式可视化图表,分析得出各省大学数量分布、本科,专科占比、各办学类别占比、985,211,双一流学校分布、开设数量前二十的专业以及国家特色专业分布等数据结果,旨在结合这些数据分析中国目前高校(大学)办学状况、中国开设数量排名前20的热门专业和国家特色专业主要分布在哪些学校等关于高校办学的信息,为报志愿的高考生和想了解这方面信息的人提供参考。 本项目分析了中国高校和专业的相关数据,旨在结合这些数据分析中国目前高校(大学)办学状况、中国开设数量排名前20的热门专业和国家特色专业主要分布在哪些学校等关于高校办学的信息,为报志愿的高考生和想了解这方面信息的人提供信息和参考。 从上面的可视化结果可以看出中国目前高校(大学)的办学状况,包括高校在各个省份的分布、本科和专科占比情况、各个办学类别占比情况、985,211,双一流分布情况,中国开设数量排名前20的热门专业和国家特色专业学校分布等关于高校办学的信息,为报志愿的高考生和想了解这方面信息的人提供信息和参考。
2021-10-14 14:04:41 1.52MB 数据分析
博主18年参加的比赛,所以近几年的赛题并没有收集了,集合一下放出来供大家学习交流~这是初赛的,参加比赛的可以了解一下。
2021-09-19 18:46:03 204.87MB SAS数据分析 SAS SAS中国高校大赛
1
中国高校环保社团调研报告.pdf
2021-07-13 09:01:36 5.17MB 行业
2015-2016中国高校毕业生胜任力报告.pdf
2021-07-03 19:02:00 71.22MB 报告
2019年最新高校Excel表格统计,含民办高校,军事高校,985高校,211高校等信息。
2021-06-30 17:57:56 197KB 高校 院校 学校
1
中国所有高校(大学),三级结构(省-市-学校)。txt,json格式。
2021-06-28 21:44:41 342KB 大学 中国高校 省市学校
1
2018-2025年中国高校后勤市场现状调研与发展前景预测分析报告.pdf
2021-06-03 09:03:41 103.39MB 咨询
给出用户在快手APP上1-30日的历史行为,预测接下来7天(31-37)的活跃用户
2021-06-01 11:21:17 23KB Python开发-机器学习
1
远卓-中国高校经营性资产管理白皮书-2019.3-22页.pdf
2021-04-25 14:05:31 750KB 行业咨询