上市公司新闻文本分析与分类预测 简介 上市公司新闻文本分析与分类预测的基本步骤如下: 从新浪财经、每经网、金融界、中国证券网、证券时报网上,爬取上市公司(个股)的历史新闻文本数据(包括时间、网址、标题、正文) 从Tushare上获取沪深股票日线数据(开、高、低、收、成交量和持仓量)和基本信息(包括股票代码、股票名称、所属行业、所属地区、PE值、总资产、流动资产、固定资产、留存资产等) 对抓取的新闻文本按照,去停用词、加载新词、分词的顺序进行处理 利用前两步中所获取的股票名称和分词后的结果,抽取出每条新闻里所包含的(0支、1支或多支)股票名称,并将所对应的所有股票代码,组合成与该条新闻相关的股票代码列表,并在历史数据表中增加一列相关股票代码数据 从历史新闻数据库中抽取与某支股票相关的所有新闻文本,利用该支股票的日线数据(比如某一天发布的消息,在设定N天后如果价格上涨则认为是利好消息,反之则是
2021-10-27 10:54:26 5.39MB machine-learning text-mining webcrawling Python
1
合流 适用于Python的时间序列实用程序库。 特征: 时间间隔均匀/不均匀的类 不等距时间序列的() 将等距时间序列转换为数据集() 时间序列的预测包装,例如keras() 安装 要求: Python3.5+ 安装: git clone https://github.com/kweimann/conflux.git cd conflux pip install . 例子 插补 有关完整的示例,请参见examples/interpolation.py 。 # number of observations n = 25 # time interval i.e. first and last timestamp t0 , tn = [ 0 , 200 ] # function producing observation value from observation ti
1
Explore and master the most important algorithms for solving complex machine learning problems. Key Features Discover high-performing machine learning algorithms and understand how they work in depth. One-stop solution to mastering supervised, unsupervised, and semi-supervised machine learning algorithms and their implementation. Master concepts related to algorithm tuning, parameter optimization, and more Book Description Machine learning is a subset of AI that aims to make modern-day computer systems smarter and more intelligent. The real power of machine learning resides in its algorithms, which make even the most difficult things capable of being handled by machines. However, with the advancement in the technology and requirements of data, machines will have to be smarter than they are today to meet the overwhelming data needs; mastering these algorithms and using them optimally is the need of the hour. Mastering Machine Learning Algorithms is your complete guide to quickly getting to grips with popular machine learning algorithms. You will be introduced to the most widely used algorithms in supervised, unsupervised, and semi-supervised machine learning, and will learn how to use them in the best possible manner. Ranging from Bayesian models to the MCMC algorithm to Hidden Markov models, this book will teach you how to extract features from your dataset and perform dimensionality reduction by making use of Python-based libraries such as scikit-learn. You will also learn how to use Keras and TensorFlow to train effective neural networks. If you are looking for a single resource to study, implement, and solve end-to-end machine learning problems and use-cases, this is the book you need. What you will learn Explore how a ML model can be trained, optimized, and evaluated Understand how to create and learn static and dynamic probabilistic models Successfully cluster high-dimensional data and evaluate model accuracy Discover how artificial neural networks work
2021-10-27 04:06:41 134.91MB 机器学习 2018
1
AutoML —一个为所有人制作ML的GUI应用程序 AutoML是一个使用Python,HTML,CSS和JS开发的桌面应用程序,可让用户进行交互和自动执行机器学习管道任务,例如 数据预处理 超参数调整 绩效评估 下载存储库以在本地运行 $ git clone https://github.com/santhalakshminarayana/AutoML.git 设置虚拟环境和安装要求 $ virtualenv AutoML $ source AutoML/bin/activate $ cd AutoML $ pip install -r requirements.txt 运行应用 $ python app.py 在上阅读有关此内容的更多信息
2021-10-27 00:34:47 1.13MB machine-learning automl eel python-gui
1
匹配LSTM 在这里我们在SQuAD上实现MatchLSTM(Wang and Jiang 2016)模型,R-Net(Wang et al.2017)模型和M-Reader(Hu et al.2017)(Rajpurkar et al.2016)。 也许有些细节与最初的论文有所不同。 要求 python3 水蟒 hdf5 实验 Match-LSTM +模型与Match-LSTM略有不同。 用GRU代替LSTM 添加类似r-net的门控注意匹配 添加单独的字符级编码 添加其他功能,例如M-Reader 在一个GRU层上添加聚合层 指针网中的初始GRU第一状态在匹配层之后添加全连接层 评估SQuAD开发人员集的结果: 模型 EM 11 Match-LSTM +(我们的版本) 70.2 79.2 Match-LSTM(纸) 64.1 73.9 R-NET-45(我
2021-10-26 18:03:51 56KB mrc pytorch squad machine-comprehension
1
基于FPGA的洗衣机系统设计,用的是VerilogHDL语言
2021-10-25 21:14:29 728KB VerilogHDL WashingMachine
1
银行营销活动分析 使用Logistic回归,随机森林,决策树,Gradient Boosting和AdaBoost等各种ML技术分析了葡萄牙银行的先前营销活动,并预测了用户是否会购买该银行的定期存款 推荐的营销团队,使用功能重要性图和业务直觉来更好地定位客户的方法 运行代码的说明: 确保数据文件(“ bank-additional-full.csv”)与ipython笔记本位于同一目录中,或相应地编辑ipython笔记本。 确保在python 3环境中运行笔记本。 确保笔记本中使用的所有依赖项都已安装在本地计算机中。 按照笔记本中的顺序依次运行代码。 对Notebook进行充分注释以给出所执行代码的合理推断。 速效 功能重要性 给营销团队的建议
1
Jx-EEGT:脑电图(EEG)特征提取工具箱 《迈向人才科学家:共享与学习》--- 介绍 此工具箱提供 30 种类型的 EEG 功能 A_Main文件显示了如何使用生成的样本信号应用特征提取方法。 输入 X : 信号 (1 x样本) opts : 参数设置(有些方法有参数:参考) 输出 feat :特征向量(您可以使用其他名称,如f2等) 用法 采用主函数jfeeg进行特征提取。 您可以通过将'me'更改为来切换方法 如果你想提取平均能量( ME ),那么你可以写 feat = jfeeg('me', X); 如果你想提取 hjorth 活动( HA ),那么你可以写 feat = jfeeg('ha', X); 示例 1:提取 3 个正常特征(不带参数) % Generate a sample random signal X fs = 500; %
1
SDC-车道和车辆检测-跟踪 Python中的OpenCV,用于自动驾驶汽车的车道线和车辆检测/跟踪 阅读我关于这个项目的 Medium。
1
NGBoost:用于概率预测的自然梯度提升 ngboost是一个Python库,实现了“自然梯度增强”,如。 它建立在,旨在针对适当的评分规则,分布和基础学习者的选择进行扩展和模块化。 在此可以对NGBoost的基本方法进行详尽的介绍。 安装 via pip pip install --upgrade ngboost via conda-forge conda install -c conda-forge ngboost 用法 波士顿住房数据集上的概率回归示例: from ngboost import NGBRegressor from sklearn . datasets import load_boston from sklearn . model_selection import train_test_split from sklearn . metrics import mean_squared_error X , Y = load_boston ( True ) X_train , X_test , Y_train , Y_test = train_test_split
1