上传者: 42137032
|
上传时间: 2021-05-13 16:11:53
|
文件大小: 49.59MB
|
文件类型: ZIP
自述文件
新浪微博自动文摘系统
给定微博话题数据集,从中筛选出前N(N> 0)条微博,作为话题摘要。
问题实质:短文本多文档自动文摘。
流程:数据-算法-评估-展现
数据获取与预先:如何通过编写爬虫获取网站数据?
摘要算法:如何使用Python及其相关工具集实现算法?(阅读论文和资料理解算法,理解公式意味着,将公式转换为实际代码,也有很多算法在Python中已经实现,可以直接使用)
摘要评估:如何对不同算法的结果进行评估?(ROUGE评估方式,中文评估注意点)
系统展现:如何实现前端展现和后台管理的系统?(Flask,Flask-Admin; Bootstrap,E-Charts)如何部署系统