伯特比 BERTopic是一种利用主题建模技术 :hugging_face: 转换程序和c-TF-IDF创建密集的群集,使主题易于理解,同时在主题描述中保留重要字词。 它甚至支持类似于LDAvis的可视化! 相应的媒体帖子可以在找到。 安装 可以使用完成安装: pip install bertopic 要使用可视化选项,请按照以下步骤安装BERTopic: pip install bertopic[visualization] 安装错误推荐使用PyTorch 1.4.0或更高版本。 如果安装出现错误,请首先安装pytorch。 入门 要详细了解BERTopic的功能,您可以在查看完整的文档也可以Google Colab笔记本。 快速开始 我们首先从著名的20个新闻组数据集中提取主题,该数据组由英文文档组成: from bertopic import BERTopic from sklearn . datasets import fetch_20newsgroups docs = fetch_20newsgroups ( subset = 'all' , remove
2021-12-14 20:36:41 2.73MB nlp machine-learning topic transformers
1
GDP_and_Employment_Rates_Prediction:一种机器学习回归模型,使用Python中的随机森林回归来预测国家的GDP和就业率
2021-12-14 20:32:48 125KB machine-learning random-forest numpy scikit-learn
1
时空数据集 收集时空数据集以用于网络科学,深度学习和通用机器学习研究。 内容 匈牙利的水痘病例 描述 匈牙利每周水痘(儿童疾病)病例的时空数据集。 该数据集由一个县级邻接矩阵和2005年至2015年之间的县级报告病例的时间序列组成。有两个特定的相关任务: 县级病例数预测。 国家一级的病例数预测。 链接 特性 导演:没有。 节点功能:是。 时间的:是的。 匈牙利县 节点数 20 边缘 61 密度 0.3211 传递性 0.4134 可能的任务 计数数据回归 引用 @misc { rozemberczki2021chickenpox , title = { {Chickenpox Cases in Hungary: a Benchmark Dataset for Spatiotemporal Signal Processing with Graph Neural
1
edge_detector:HED实时iOS边缘检测器
2021-12-14 17:59:09 61.06MB swift ios machine-learning mobile
1
御坂翻译器—Galgame/文字游戏/漫画多语种实时机翻工具 MisakaTranslator 御坂翻译器 Galgame/文字游戏/漫画多语种实时机翻工具 开源 | 高效 | 易用 中文 • English MisakaTranslator的名字由来是因为本软件连接到了一万多名御坂妹妹所组成的『御坂网络』,利用其强大的计算能力来提供实时可靠的翻译(误) MisakaTranslator官方网站 测试版演示视频 2.0版本教程 软件功能及特点 兼容性强:支持Hook+OCR两种方式提取游戏文本,能适配绝大多数游戏 可离线:支持完全离线工作(Hook模块离线、可选的Tesseract-OCR模块离线、三种离线翻译API) 高度可拓展的文本修复:针对Hook提取到的重复文本提供多种去重方式 提供更好体验的在线API:提供多种在线API(百度OCR+多种在线翻译API+多种公共接口翻译) 更高的OCR精度:支持在提交OCR前对图片进行预处理(多种处理方法) 分词及字典:支持Mecab分词和字典功能,可针对单词进行查询 翻译优化系统:支持人名地名欲翻译,提高翻译质
2021-12-14 17:10:20 2.85MB .NET Machine Learning
1
网络管道:网络流量数据管道,用于实时预测和构建深度神经网络的数据集
2021-12-14 14:08:07 314KB redis flask machine-learning django
1
pyts:用于时间序列分类的Python包 pyts是用于时间序列分类的Python软件包。 它旨在通过提供预处理和实用工具以及最新算法的实现,使时间序列分类易于访问。 这些算法大多数都会转换时间序列,因此pyts提供了多种工具来执行这些转换。 安装 依存关系 pyts要求: Python(> = 3.6) NumPy(> = 1.17.5) SciPy(> = 1.3.0) Scikit-Learn(> = 0.22.1) Joblib(> = 0.12) Numba(> = 0.48.0) 要运行示例,需要Matplotlib(> = 2.0.0)。 用户安装 如果您已经可以正常安装numpy,scipy,scikit-learn,joblib和numba,则可以使用pip轻松安装pyts。 pip install pyts 或conda经由conda-forge通道 conda install -c conda-forge pyts 您还可以通过克隆存储库来获取最新版本的pyts git clone https://github.com/johannfaouzi
2021-12-14 11:21:18 2.59MB python machine-learning timeseries classification
1
matlab的egde源代码机器学习 存储库包含我在MATLAB和PYTHON中实现的机器学习算法 使用的Alogrithm是: 决策树和随机森林分类器 朴素贝叶斯分类器 高斯朴素贝叶斯Calssifier 高斯混合的EM算法 神经网络 奇异值分解 主成分分析 将数据拟合到一维高斯 使数据适合2D高斯 K最近的邻居 线性回归 逻辑回归 K均值聚类 价值迭代法 动态时间规整 误差函数和正则化
2021-12-14 10:34:53 7.62MB 系统开源
1
ECLAT关联规则挖掘 等价类转换关联规则挖掘算法的Python实现 我在无聊的时候写了这篇文章,并希望找到一个很好的算法来加快Cython的速度。 不幸的是,这个问题并不能轻易实现优化(而频繁模式挖掘的FP-tree方法要快得多)。 该算法在其擅长的各种数据集上(存储10个具有100万条记录的商品的商店)仍然非常快,但是在1000个具有1000条记录的商品的数据集上,它会显得很笨拙。 我的工作很乱。 也许我会回去整理一天。
1