上市公司新闻文本分析与分类预测 简介 上市公司新闻文本分析与分类预测的基本步骤如下: 从新浪财经、每经网、金融界、中国证券网、证券时报网上,爬取上市公司(个股)的历史新闻文本数据(包括时间、网址、标题、正文) 从Tushare上获取沪深股票日线数据(开、高、低、收、成交量和持仓量)和基本信息(包括股票代码、股票名称、所属行业、所属地区、PE值、总资产、流动资产、固定资产、留存资产等) 对抓取的新闻文本按照,去停用词、加载新词、分词的顺序进行处理 利用前两步中所获取的股票名称和分词后的结果,抽取出每条新闻里所包含的(0支、1支或多支)股票名称,并将所对应的所有股票代码,组合成与该条新闻相关的股票代码列表,并在历史数据表中增加一列相关股票代码数据 从历史新闻数据库中抽取与某支股票相关的所有新闻文本,利用该支股票的日线数据(比如某一天发布的消息,在设定N天后如果价格上涨则认为是利好消息,反之则是
2021-10-27 10:54:26 5.39MB machine-learning text-mining webcrawling Python
1
本书旨在用作研究生水平的教科书和技术参考。 重点是基本概念,分析技术和基本经验方法。 唯一的前提条件是有关傅立叶分析的入门课程。
2021-10-27 09:57:57 41.44MB 数学
1
Python 代码,最好还是自己敲代码
2021-10-26 23:01:18 172KB Python
1
Dive deeper into data analysis with the flexibility of Python and learn how its extensive range of scientific and mathematical libraries can be used to solve some of the toughest challenges in data analysis. Build your confidence and expertise and develop valuable skills in high demand in a world driven by Big Data with this expert data analysis book. This data science tutorial will help you learn how to effectively retrieve, clean, manipulate, and visualize data and establish a successful data analysis workflow. Apply the impressive functionality of Python's data mining tools and scientific and numerical libraries to a range of the most important tasks within data analysis and data science, and develop strategies and ideas to take control your own data analysis projects. Get to grips with statistical analysis using NumPy and SciPy, visualize data with Matplotlib, and uncover sophisticated insights through predictive analytics and machine learning with SciKit-Learn. You will also learn how to use the tools needed to work with databases and find out how Python can be used to analyze textual and social media data, as you work through this essential data science tutorial.
2021-10-26 22:58:42 24.13MB Python Data Analysis NumPy
1
DeepLabCut是一个工具箱,用于无标记地估计执行各种任务的动物的姿势。 。 只要您可以看到(标记)要跟踪的内容,就可以使用此工具箱,因为它与动物和物体无关。 最新更新: :purple_heart: DeepLabCut支持多动物姿势估计(BETA版本,请给我们提供反馈! pip install deeplabcut==2.2b8 )。 :purple_heart: 我们有一个实时软件包! 快速pip install deeplabcut : pip install deeplabcut 您还需要tensorflow和wxPython参见 项目管理的管道和工作流程的概述。 有关循序渐进的用户指南,请阅读《! 为了更深入地
1
ÇrowdÇountingÇODE框架(C ^ 3-框架) Python 3开发人员版本! 开源的PyTorch代码用于人群计数 注意:由于个人原因,该代码将不会继续保留。 我建议您在使用或其他出色的代码。 技术博客 [2019.05] [中文博客] C ^ 3框架系列之一:一个基于PyTorch的开源人群计数框架[] 目标 该代码的目的是一个有效,灵活的框架,用于监督人群计数。 同时,我们在主流数据集上提供了一些基本网络和经典算法的性能。 特征 方便的开发套件。 它是六个主要数据集上的便捷开发套件。 坚实的基线。 它提供了一些经典的预训练模型的基线,例如AlexNet,VGG,ResNet等。 在此基础上,您可以轻松地将建议的模型与它们的效果进行比较。 强大的日志。 它不仅可以在Tensorboard中记录丢失和可视化,还可以保存当前代码包(包括参数设置)。 保存的代码包可以直接运
1
复分析 复变函数 Stein一共写了四本,佛立叶,复分析,泛函,实分析。
2021-10-26 14:03:17 2.93MB Complex Analysis Stein
1
银行营销活动分析 使用Logistic回归,随机森林,决策树,Gradient Boosting和AdaBoost等各种ML技术分析了葡萄牙银行的先前营销活动,并预测了用户是否会购买该银行的定期存款 推荐的营销团队,使用功能重要性图和业务直觉来更好地定位客户的方法 运行代码的说明: 确保数据文件(“ bank-additional-full.csv”)与ipython笔记本位于同一目录中,或相应地编辑ipython笔记本。 确保在python 3环境中运行笔记本。 确保笔记本中使用的所有依赖项都已安装在本地计算机中。 按照笔记本中的顺序依次运行代码。 对Notebook进行充分注释以给出所执行代码的合理推断。 速效 功能重要性 给营销团队的建议
1
飞行数据分析 我们的数据集包含有关2013年从纽约出发的所有航班的信息,总共包含约336,776个航班。 软件和库: Jupyter笔记本 Python 3.x 脾气暴躁的 大熊猫 MatplotLib 海生 熊猫分析 该数据集由以下变量组成: 年:2013 月:1-12 日期:每月的某天(1-31) dep_time:出发时间,当地时区 sched_dep_time:预定出发时间 dep_delay:出发延迟时间(以分钟为单位),负数表示提早出发 arr_time:到达时间,本地时区 sched_arr_time:预定到达时间 arr_delay:到达延迟(以分钟为单位),负数表示提前到达 载体:两个字母的缩写 航班:航班号 tailnum:平面尾号 原点:原点的机场代码 dest:目的地的机场代码 air_time:在空中停留的时间,以分钟为单位 距离:飞行距离,以英里
2021-10-25 19:35:34 486KB JupyterNotebook
1
图像处理,关于干涉条纹的应用处理,例如解相位等方法
2021-10-25 17:15:31 3.05MB Interfe
1