Python 豆瓣书评 bs4多页爬虫 jieba中文分词 tf-idf向量化 kmeans聚类+统计词频 +停用词 douban图书评价 浏览器多页爬虫 jupyter notebook numpy pandas sklearn 数据分析 数据挖掘
2023-03-09 10:46:03 1.57MB 爬虫 NLP kmeans 数据挖掘
1
Python 58同城房价bs4 beautiful soup爬虫获取 room_name room_type room_area room_addr0 room_addr1 room_price房价名称类型面积地址价格等 jieba中文分词 tf-idf向量化 kmeans聚类 浏览器多页爬虫 jupyter notebook numpy pandas sklearn 数据分析 数据挖掘
2023-02-22 22:22:27 113KB jieba NLP 爬虫 kmeans
1
垃圾邮件分类---安然数据集 使用逻辑回归和计数向量化将Enron数据集的电子邮件分为垃圾邮件或火腿邮件。 注意:彻底评论了Jupyter / IPython笔记本,因此这里不需要广泛的自述文件。
2023-01-25 17:31:14 30.69MB
1
主要用的numpy库实现的,其中数据点的生成可以看我另外一个作业模式识别作业:....聚类设计那个用来生成数据
2022-12-14 18:15:59 34KB python k_means C均值 聚类
1
tsmoothie 一个用于以向量化方式进行时间序列平滑和离群值检测的python库。 总览 tsmoothie以快速有效的方式计算单个或多个时间序列的平滑度。 可用的平滑技术是: 指数平滑 具有各种窗口类型(常量,汉宁,汉明,巴特利特,布莱克曼)的卷积平滑 使用傅立叶变换进行频谱平滑 多项式平滑 各种样条平滑(线性,三次,自然三次) 高斯平滑 Binner平滑 低价 各种季节性分解平滑(卷积,最低,自然三次样条) 带有可自定义组件(水平,趋势,季节性,长期季节性)的卡尔曼平滑 tsmoothie提供了平滑处理结果的间隔计算。 这对于识别时间序列中的异常值和异常可能很有用。 关于使用的平滑方法,可用的间隔类型为: sigma间隔 置信区间 预测间隔 卡尔曼区间 tsmoothie可以执行滑动平滑方法来模拟在线使用。 可以将时间序列分成相等大小的片段,并分别进行平滑处理。 与往常一样,此功能通过WindowWrapper类以矢量化方式实现。 tsmoothie可以通过BootstrappingWrapper类操作时序引导程序。 支持的引导程序算法为: 没有重叠的块引导
2022-11-20 23:23:57 1.23MB bootstrap timeseries time-series smoothing
1
MATLAB向量化编程基础精讲 [马良,祁彬彬][北京航空航天大学出版社]有书签 高清扫描版
2022-09-17 16:14:22 156.29MB MATLAB
1
文本特征向量化
2022-08-21 18:06:01 547KB 文本特征向量化
1
PSO 最基本的代码已经在这里展示了。 它对刚接触编码的人最有帮助。 它可以用于任何优化问题。 作为一种启发式算法,它倾向于找到全局最小值,并且随着代码被矢量化,速度也得到了提高。 所提供的文件适用于无约束函数,但借助惩罚函数,可以轻松约束问题。 如果它适用于许多用户,我打算为 PSO 开发一个 GUI,并提供受约束的 PSO 文件。 还添加了广泛使用的用于检查 PSO 功能的基准功能。 还添加了改进的 PSO 文件,其中考虑了线性变化的惯性权重值。 如果有帮助,请在评论中告诉我。
2022-08-13 23:35:54 8KB matlab
1
MATLAB向量化编程基础精讲 配套源程序 一本非常好的MATLAB进阶书籍,能提高个人的代码阅读能力和编程能力。
2022-07-27 17:51:46 130KB MATLAB
1
DB - Balancing Vectorized Query Execution with Bandwidth-Optimized Storage.pdf I had two supervisors at CWI. Martin Kersten always kept an eye on what this new student from Poland was doing, and teased me with hard problems and tricky questions when appropriate. Still, it was Peter Boncz who had to live with all my questions, ideas, problems and complaints almost every day. The discussions we had were one of the most thought-stimulating moments of my life, even when we disagreed on ...
2022-07-12 20:05:15 1.46MB 数据库 向量化 执行器
1