文字挖掘 该文件夹包含我的各种AI和机器学习项目的文本分析和自然语言处理(NLP)模型。
2021-11-17 12:01:59 219KB JupyterNotebook
1
机器学习入门,包含源码+训练测试数据。使用模型LR和GDBT,评估方法使用:准确度、F1-Score
2021-11-14 18:07:10 2.27MB 机器学习 LR 决策树 入门
java考试参考使用。仅供学习参考。
2021-11-09 13:02:08 579KB java
1
KH coder 文本分析工具,亲测可用,日语、英语、汉语都可以进行分析(值得一试)
2021-10-28 22:01:52 660.77MB kncoder 文本分析 相关性分析 共线分析
上市公司新闻文本分析与分类预测 简介 上市公司新闻文本分析与分类预测的基本步骤如下: 从新浪财经、每经网、金融界、中国证券网、证券时报网上,爬取上市公司(个股)的历史新闻文本数据(包括时间、网址、标题、正文) 从Tushare上获取沪深股票日线数据(开、高、低、收、成交量和持仓量)和基本信息(包括股票代码、股票名称、所属行业、所属地区、PE值、总资产、流动资产、固定资产、留存资产等) 对抓取的新闻文本按照,去停用词、加载新词、分词的顺序进行处理 利用前两步中所获取的股票名称和分词后的结果,抽取出每条新闻里所包含的(0支、1支或多支)股票名称,并将所对应的所有股票代码,组合成与该条新闻相关的股票代码列表,并在历史数据表中增加一列相关股票代码数据 从历史新闻数据库中抽取与某支股票相关的所有新闻文本,利用该支股票的日线数据(比如某一天发布的消息,在设定N天后如果价格上涨则认为是利好消息,反之则是
2021-10-27 10:54:26 5.39MB machine-learning text-mining webcrawling Python
1
文本预处理介绍 文本预处理一般是指将原始数据通过数据转换,缺失处理等手段转化为符合要求的“新”数据集的过程。预处理本身是一件极其耗费时间的事情,繁琐且涉及细节很多。预处理做的不好,对后面的建模分析等等都会有很大的影响。 对于自然语言的文本数据,处理过程一般包括文本清洗、分词等,其中每个步骤在中英文处理时都有些不同,如中文分词的难度远大于英文,而英文需要转换大小写、词形还原等步骤。 接下来将会分别介绍中英文预处理中的重点环节,结合实际介绍和使用包括jeba,NLTK 等工具包,实现分词和词干提取等步骤,最后展示完成一个(词频统计)实际任务。 一般来说,文本数据预处理的第一步是文本清洗,这个环节非
2021-10-26 15:35:32 46KB 分词 文本分析 替换
1
文本分析的东西。可以看看文本分析的东西。可以看看文本分析的东西。可以看看文本分析的东西。可以看看文本分析的东西。可以看看
2021-10-22 21:07:01 418KB 文本
1
(结合哈工大停用词表、四川大学机器智能实验室停用词库、百度停用词表等)
1
基于网络文本分析和问卷调查的丹东旅游形象感知思考范文.docx
2021-10-14 14:07:25 169KB 网络
[戴森球计划]原始分析 [Dyson Sphere计划] src分析 成分 设定档 数据 小发明 播放器 原型 原型集 渲染器 UIGame UIRoot 人物UI 人物动作 人物运动 对象池 建筑UI 戴森球面板UI 绝对 教程UI 星图UI 显示UI 机甲UI 杂项UI 沙土UI 生产配方UI 电力相关UI 矿脉UI 研究人数UI 科技树UI 航行UI AbsorbOrder 帐号数据 添加剂 顾问提示 AdvisorTipProtoSet 环境描述 动画组件 动画数据 动画描述 汇编器组件 断言 资产清单 天文姿势 音频容器 音频数据 音频对象 音频池 音频协议 音频协议集 批处理渲染器 皮带组件 皮带描述 BeltRenderingBatch BGM控制器 广告牌 BlackHoleHandler BoxGiz
2021-09-29 20:55:48 32.48MB 系统开源
1