zhwiki-gensim-word2vec The goal of this assignment is to train a Word2Vec using gensim over zhwiki() data and show the result by TSNE. 用Wikipedia的中文数据训练Word2Vec 1 下载数据() 2 解压数据 WikiExtractor 3 数据准备 a. jieba切词 b. 数据清洗、去停用词 c. 繁体化简体 OpenCC 4 用gensim 训练 Word2Vec 5 结果显示 TSNE
2023-02-04 23:32:08 1.02MB JupyterNotebook
1
使用BigDL在Apache Spark上进行深度学习的教程 使用在Apache Spark上的分步深度学习教程。 这些教程的灵感来自, 和。 主题 环境 的Python 3.5 / 3.6 JDK 8 Apache Spark> = 2.2.1 Jupyter笔记本电脑4.1 大DL 0.7.0 / 启动Jupyter服务器 运行pip install BigDL==0.7.0 运行jupyter notebook --notebook-dir=./ --ip=0.0.0.0 --no-browser 启动Toree Kernel以运行Scala笔记本 运行pip install BigDL==0.7.0 运行pip install https://dist.apache.org/repos/dist/release/incubator/toree/0.2.0-incuba
2023-01-19 12:15:12 11.35MB JupyterNotebook
1
CA贫困和中位数收入 加利福尼亚州2019年贫困百分比估计和家庭收入中位数的数据可视化。
2023-01-17 18:50:39 17KB JupyterNotebook
1
此存储库包含一个示例,该示例说明如何使用Qiskt中的QAOA解决MAX-CUT问题
2023-01-13 19:36:52 74KB JupyterNotebook
1
车辆图像识别 概括 该项目的目标是根据斯坦福大学AI网站( )上预先配置的数据集,按品牌,型号和年份对汽车进行分类。 数据预先设置了所有图像的标签和边框。 将图像调整为边界框尺寸,并保存为原始图像。 通过使用TensorFlow的图像数据生成器将图像转换为像素数据矩阵,使用了卷积神经网络将看不见的验证图像分类为不同的汽车品牌。 从网站上找到的所有数据的总和来看,总共有16,185张图像,分为90/10的训练/测试比率。 像EfficientNet系列和InceptionV3这样的预先训练的模型,以前在'Imagenet'数据集上进行了训练,用于获得〜85%的最终精度。 结果 使用EfficientNetB1的模型格式,其中一部分图层保持在ImageNet数据集上学习的预训练权重,基于CNN模型看不到的图像,预测特定汽车的年份,品牌和模型的准确性达到〜85%。 。 以下是结果和模型的摘要:
2023-01-10 16:05:41 933KB JupyterNotebook
1
量化金融自学培训教材 版权 版权所有(c)2020 Python Charmers Pty Ltd,Australia, //pythoncharmers.com。 版权所有。 执照 根据知识共享署名-非商业4.0国际(CC BY-NC 4.0)许可发布。 有关详细信息,请参见LICENSE.md 。 赞助 由Tibra全球服务赞助, //tibra.com
2023-01-10 00:29:54 3.14MB JupyterNotebook
1
PUBG-数据分析
2023-01-09 20:18:01 4.5MB JupyterNotebook
1
Scikit学习 Scikit-learn:是用于Python编程语言的免费软件机器学习库。 它具有各种分类,回归和聚类算法,包括支持向量机,随机森林,梯度提升,k均值和DBSCAN,并且旨在与Python数值和科学库NumPy和SciPy互操作。 机器学习中任何项目的步骤: 数据文件并附加数据 数据清理,并从功能之间的关联中学习。 功能选择 数据缩放 数据分割 选择最佳算法(回归分类-SVM-KMeans-KNN .....)。
2023-01-09 13:48:09 8.98MB JupyterNotebook
1
该存储库包含视频功能提取脚本的集合。 这些功能利用OpenPose,PoTion和动态图像网络进行预处理。 参考: [1] OpenPose:使用零件相似性字段进行实时多人2D姿势估计,Cao等。 [2] [3] PoTion:用于动作识别的姿势运动表示,Choutas等。
2023-01-08 23:09:35 11KB JupyterNotebook
1
交通标志识别 在这个项目中,我使用卷积神经网络对交通标志进行分类。 具体来说,我训练了一个模型,用于根据“德国交通标志对交通标志进行分类。 我使用TensorFlow进行模型开发,并在GPU上对其进行了训练。 分几个步骤: 加载数据集 探索,总结和可视化数据集 设计,训练和测试模型架构 使用模型对新图像进行预测 分析新图像的softmax概率 完整的项目代码可以在找到 数据集摘要与探索 1.数据集的基本摘要。 此步骤的代码包含在的3d code cell中 我使用了pandas库来计算交通标志数据集的摘要统计信息: 训练示例数= 34799 测试例数= 12630 图像数据形状=(32,32,3) 班级数量= 43 2.数据集的探索性可视化。 该步骤的代码包含在的5th code cell中。 这是数据集的探索性可视化。 它是显示数据分布方式的条形图。 我们看到分布不均。
2023-01-06 20:41:07 145KB JupyterNotebook
1