2020美赛C题实现NLP
2022-02-13 19:00:52 24.85MB 自然语言处理 matlab c语言 人工智能
1
wikitextparser:MediaWiki的简单WikiText解析库
2022-01-12 13:14:14 140KB python parsing mediawiki text-analysis
1
LIME-Text_Data 在文本数据上实现LIME(本地可解释模型不可知的解释)。 这有助于直观地解释为什么模型预测了预测的内容。 笔记本使用简单的分类任务突出显示做出预测的贡献者(请参见下文): 了解更多信息并了解其下的功能 阅读: :
1
上市公司新闻文本分析与分类预测 简介 上市公司新闻文本分析与分类预测的基本步骤如下: 从新浪财经、每经网、金融界、中国证券网、证券时报网上,爬取上市公司(个股)的历史新闻文本数据(包括时间、网址、标题、正文) 从Tushare上获取沪深股票日线数据(开、高、低、收、成交量和持仓量)和基本信息(包括股票代码、股票名称、所属行业、所属地区、PE值、总资产、流动资产、固定资产、留存资产等) 对抓取的新闻文本按照,去停用词、加载新词、分词的顺序进行处理 利用前两步中所获取的股票名称和分词后的结果,抽取出每条新闻里所包含的(0支、1支或多支)股票名称,并将所对应的所有股票代码,组合成与该条新闻相关的股票代码列表,并在历史数据表中增加一列相关股票代码数据 从历史新闻数据库中抽取与某支股票相关的所有新闻文本,利用该支股票的日线数据(比如某一天发布的消息,在设定N天后如果价格上涨则认为是利好消息,反之则是
2021-10-27 10:54:26 5.39MB machine-learning text-mining webcrawling Python
1
EDGAR-报告-文本分析 从EDGAR灌装中提取数据并进行文本分析。 在该项目中,对EDGAR灌装进行了文本数据提取和文本分析。 分析是在10k和10Q填充时完成的。 它是使用python执行的。 输入 输入文件包含与EDGAR不同的填充。 格式为.txt。 总共处理了152个文件。 提取与分析 A.进行基本清洁,并使用正则表达式提取目标切片。 目标部分是- 管理层的讨论与分析 关于市场风险的定量和定性披露 风险因素 B.进行了文本分析的不同部分,其中包括- 情绪分析 可读性分析 复杂字数 字数 情绪分析 使用基于词法的方法进行情感分析。 积极得分:如果在“积极字典”中找到每个单词,则为其分配+1值,然后将所有值相加即可得出该得分。 否定分数:如果在“否定字典”中找到每个单词,则为其分配-1的值,然后将所有值相加即可得出该分数。 我将分数乘以-1,以便分数为正数。 极性分数
2021-09-18 23:12:09 84KB JupyterNotebook
1
码云上的文本分析-Listed-company-news-crawl-and-text-analysis-master.zip
2021-07-20 15:05:20 113KB python
1
用python应用文本分析,狐狸书,超高清PDF+源代码。
2021-07-12 22:51:36 29.59MB 自然语言处理 Python
1
解压密码 share.weimo.info With Early Release ebooks, you get books in their earliest form—the author's raw and unedited content as he or she writes—so you can take advantage of these technologies long before the official release of these titles. You’ll also receive updates when significant changes are made, new chapters are available, and the final ebook bundle is released.The programming landscape of natural language processing has changed dramatically in the past few years. Machine learning approaches now require mature tools like Python’s scikit-learn to apply models to text at scale. This practical guide shows programmers and data scientists who have an intermediate-level understanding of Python and a basic understanding of machine learning and natural language processing how to become more proficient in these two exciting areas of data science.This book presents a concise, focused, and applied approach to text analysis with Python, and covers topics including text ingestion and wrangling, basic machine learning on text, classification for text analysis, entity resolution, and text visualization. Applied Text Analysis with Python will enable you to design and develop language-aware data products.You’ll learn how and why machine learning algorithms make decisions about language to analyze text; how to ingest, wrangle, and preprocess language data; and how the three primary text analysis libraries in Python work in concert. Ultimately, this book will enable you to design and develop language-aware data products.,解压密码 share.weimo.info
2021-07-12 21:41:39 1.94MB 英文
1
适用于社会科学家的Python文本分析–发现与探索 本页包含社会科学家使用Python进行文本分析的中的代码示例。
2021-03-21 17:08:54 11KB text-analysis social-sciences JupyterNotebook
1