EDGAR-reports-Text-Analysis:从EDGAR灌装中提取数据并进行文本分析-源码

上传者: 42161497 | 上传时间: 2021-09-18 23:12:09 | 文件大小: 84KB | 文件类型: ZIP
EDGAR-报告-文本分析 从EDGAR灌装中提取数据并进行文本分析。 在该项目中,对EDGAR灌装进行了文本数据提取和文本分析。 分析是在10k和10Q填充时完成的。 它是使用python执行的。 输入 输入文件包含与EDGAR不同的填充。 格式为.txt。 总共处理了152个文件。 提取与分析 A.进行基本清洁,并使用正则表达式提取目标切片。 目标部分是- 管理层的讨论与分析 关于市场风险的定量和定性披露 风险因素 B.进行了文本分析的不同部分,其中包括- 情绪分析 可读性分析 复杂字数 字数 情绪分析 使用基于词法的方法进行情感分析。 积极得分:如果在“积极字典”中找到每个单词,则为其分配+1值,然后将所有值相加即可得出该得分。 否定分数:如果在“否定字典”中找到每个单词,则为其分配-1的值,然后将所有值相加即可得出该分数。 我将分数乘以-1,以便分数为正数。 极性分数

文件下载

资源详情

[{"title":"( 12 个子文件 84KB ) EDGAR-reports-Text-Analysis:从EDGAR灌装中提取数据并进行文本分析-源码","children":[{"title":"EDGAR-reports-Text-Analysis-master","children":[{"title":"uncertainty_dictionary.txt <span style='color:#111;'> 3.41KB </span>","children":null,"spread":false},{"title":"textAnalysisOutput.csv <span style='color:#111;'> 34.07KB </span>","children":null,"spread":false},{"title":"constraining_dictionary.txt <span style='color:#111;'> 1.99KB </span>","children":null,"spread":false},{"title":"textAnalysisOutput.xlsx <span style='color:#111;'> 46.59KB </span>","children":null,"spread":false},{"title":"NegativeWords.txt <span style='color:#111;'> 26.30KB </span>","children":null,"spread":false},{"title":"EDGAR extraction and Analysis.ipynb <span style='color:#111;'> 108.07KB </span>","children":null,"spread":false},{"title":"EDGAR extraction and Analysis.md <span style='color:#111;'> 44.86KB </span>","children":null,"spread":false},{"title":"PositiveWords.txt <span style='color:#111;'> 3.91KB </span>","children":null,"spread":false},{"title":"StopWords_Generic.txt <span style='color:#111;'> 722B </span>","children":null,"spread":false},{"title":"README.md <span style='color:#111;'> 2.56KB </span>","children":null,"spread":false},{"title":"EDGAR extraction and Analysis.py <span style='color:#111;'> 14.65KB </span>","children":null,"spread":false},{"title":"cik_list1.csv <span style='color:#111;'> 12.94KB </span>","children":null,"spread":false}],"spread":false}],"spread":true}]

评论信息

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明