本项目包含作业要求和源代码,项目基于Python Scrapy爬虫实现对上市公司股民评论的爬取和公司年报的爬取;基于Python Tushare 爬取上市公司行情图,对爬取的内容进行预处理,包括分词、去停用词、转化词袋模型等。最后可视化结果,可视化清晰明了,可作为公司是否存在会计欺诈手段的检测
2021-11-19 12:03:26 34.88MB Scrapy Python预处理大作业 分词、可视化
nyu-depth-v2-tools:[2]中使用的工具,用于预处理地面真值分割以评估超像素算法
1
555555555555555555555
2021-11-18 09:07:18 2.43MB 55
1
对数据进行预处理,让后再用spss进行处理数据。
2021-11-17 18:53:28 276KB 预处理
1
关于在英语语料库上进行词嵌入训练的研究很多。 该工具包通过在德语语料库上应用深度学习,以训练和评估德语模型。 有关项目,评估结果和的概述可在或直接在此存储库中找到。 该项目是根据发布的。 开始吧 确保已安装Python 3以及以下库: pip install gensim nltk matplotlib numpy scipy scikit-learn 现在,您可以下载并在您的Shell中执行它,以自动下载此工具包和相应的语料库文件并进行模型训练和评估。 请注意,这可能需要大量时间! 您也可以克隆此存储库,并使用我已经进行评估和可视化。 如果您只想查看不同Python脚本的工作方式,
1
由于红外图像预处理算法自身的复杂性,使得红外图像在DSP中的预处理时间较长。针对这一问题,提出一种基于FPGA的实时红外图像预处理方法。该方法采用了流水线技术来并行完成非均匀校正、空间滤波、直方图统计等多个红外图像预处理算法,对系统结构进行了改进和优化。经过实验测试验证,该方法合理可行,能够实时高效地完成红外图像预处理任务。与DSP图像预处理系统相比可以节约将近50%的处理时间。
1
“使用Pandas进行数据预处理”博文,的数据集,可以直接学习使用。博文连接 https://blog.csdn.net/weixin_42837961/article/details/104276607
2021-11-14 21:06:02 430KB python pandas
1
Pcap预处理器 一个开源工具包库,用于预处理网络流量.pcap数据。 需求前环境 环境要求 需要python3.7或更高版本。 设定环境 安装虚拟环境 pip install virtualenv 创建venv目录 python3 -m venv .venv 激活虚拟环境 source .venv/bin/activate 从requirements.txt安装软件包 pip install -r requirements.txt 停用虚拟环境 deactivate 数据存储约定 数据/ <数据集名称> / raw_pcap / parsed_pcap / extract_tcp / 物理特征/ <数据集名称> _combined_physical_features.csv physical_features_by_device / features_by_device /
2021-11-12 10:36:30 7KB Python
1
将一张大图片切割成多张小图片,并标记每张图片的类型。保存为一个csv文件。软件实现了图片放大,缩小,跳转、翻页等基本功能。实用性高。
2021-11-11 15:35:51 34.23MB pyqt 深度学习 图片预处理
1
自然语言预处理(NLPre) 主要版本更新! NLPre 2.0.0 后端NLP引擎pattern.en已被spaCy v 2.1.0取代。 这是针对pattern.en某些问题(包括不良lemmatization)的主要解决方案。 (例如,细胞因子->细胞牛) 对python 2的支持已被删除 在replace_from_dictionary支持自定义词典 在replace_from_dictionary使用后缀而不是前缀的选项 URL替换现在可以删除电子邮件 token_replacement可以删除符号 NLPre是一个文本(预处理)库,可帮助消除实际数据中发现的某些不一致之处。 纠
1