基于《诗经》语料的实验结果表明: 现有机器学习及自然语言处理技术可以对《诗经》文本做出一些有较好解释性的工作,验证已有的文学研究论点,并在传统的研究范式之外,对

上传者: 44510615 | 上传时间: 2021-07-08 15:02:42 | 文件大小: 6.63MB | 文件类型: ZIP
诗歌在中国是一个极为重要且历史悠久的文学体裁。纵横千年的时间跨度、数量巨大的诗人群体、卷帙浩繁的诗歌文本都使得在传统的文本阅读方式下,中国诗歌的宏观把握变得极其不易。因此,随着计算机算力与计算模型的发展,越来越多的研究者将目光聚焦到了使用计算机对诗歌进行文本分析的研究领域,已有研究者对中国古诗进行了统计建模与宏观分析$^{[1]}$,但所用文本语料多为《全唐诗》《全宋词》等,以《诗经》为语料的文本分析研究,未之有也。因此需要有人在这个方面进行一些探索,本文便是一次尝试, 试图从另一个视角出发,更高效地处理《诗经》文本,并提供文本分析视角下对《诗经》的宏观刻画、描述与阐释。 本文从字频、词频、文本长度、文本方差、情感分析、提取主题词等各个维度,对《诗经》进行了以下文本分析: 首先从单字的角度,对诗经进行了字数、字频、各句长度方差等统计。 经过效果对比,选用北京大学的分词工具Pkuseg,对《诗经》进行分词处理。 在分词基础上统计词频且生成词云。 通过文本长度,文本方差来寻找风雅颂三部分之间的差异。 通过对《诗经》中篇目的情感分析,绘制出风雅颂各部分的情感变化曲线。 提取出文本中的主题词,并以此为基础构建出每篇作品的文本向量。 选定文本长度,文本方差,文本向量作为作品的三个特征,共同组成一个样本来表达一篇作品。 抽取样本,通过计算距离的方式对《诗经》中风雅颂三部分进行聚类,绘制出表达聚类效果的轮廓系数曲线。 以束皙的六首《补亡诗》与陶渊明的四首《时运》为例,计算二者作品与《诗经》的相似程度。

文件下载

资源详情

[{"title":"( 18 个子文件 6.63MB ) 基于《诗经》语料的实验结果表明: 现有机器学习及自然语言处理技术可以对《诗经》文本做出一些有较好解释性的工作,验证已有的文学研究论点,并在传统的研究范式之外,对","children":[{"title":"Text-analysis-of-the-book-of-songs-main","children":[{"title":"report.py <span style='color:#111;'> 4.56KB </span>","children":null,"spread":false},{"title":"character frequency.png <span style='color:#111;'> 19.71KB </span>","children":null,"spread":false},{"title":"discrete.py <span style='color:#111;'> 3.90KB </span>","children":null,"spread":false},{"title":"vector.py <span style='color:#111;'> 41.80KB </span>","children":null,"spread":false},{"title":"青鸟华光简隶变.ttf <span style='color:#111;'> 3.99MB </span>","children":null,"spread":false},{"title":"cn_stopwords.txt <span style='color:#111;'> 4.61KB </span>","children":null,"spread":false},{"title":"基于《诗经》的文本分析.pdf <span style='color:#111;'> 1.98MB </span>","children":null,"spread":false},{"title":"feng.png <span style='color:#111;'> 49.91KB </span>","children":null,"spread":false},{"title":"LICENSE <span style='color:#111;'> 1.05KB </span>","children":null,"spread":false},{"title":"compare.py <span style='color:#111;'> 798B </span>","children":null,"spread":false},{"title":"shijing.json <span style='color:#111;'> 153.21KB </span>","children":null,"spread":false},{"title":"无标题.png <span style='color:#111;'> 1.67MB </span>","children":null,"spread":false},{"title":"ya.png <span style='color:#111;'> 44.55KB </span>","children":null,"spread":false},{"title":"轮廓系数.png <span style='color:#111;'> 14.17KB </span>","children":null,"spread":false},{"title":"song.png <span style='color:#111;'> 39.02KB </span>","children":null,"spread":false},{"title":"emotion.py <span style='color:#111;'> 1.93KB </span>","children":null,"spread":false},{"title":"README.md <span style='color:#111;'> 23.21KB </span>","children":null,"spread":false},{"title":"vector.txt <span style='color:#111;'> 35.84KB </span>","children":null,"spread":false}],"spread":false}],"spread":true}]

评论信息

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明