上传者: 54626591
|
上传时间: 2022-12-21 19:57:50
|
文件大小: 26.84MB
|
文件类型: TAR
设计一个程序,读出threekingdoms.txt文件中的三国演义全文,将常见人名进行去重后生成词云,并列出词频最高的5个词。
例:'玄德','刘备','玄德曰','刘皇叔','皇叔'都是同一个人。
可利用字典来保存需要去重的词。
dupDict={'曹操' : ['孟德','丞相'],
'玄德' : ['刘备','皇叔','刘皇叔','玄德曰'],
'云长' : ['关羽','关云长','关公'],
'孔明' : ['诸葛亮','诸葛','孔明曰'],
'张飞' : ['翼徳'],
'赵云' : ['子龙','赵子龙'],
'周瑜' : ['公瑾','都督']}