利用wikipedia语料训练word2vec代码,中英文都可,语料自行下载
2022-11-16 00:13:59 5KB word2vec
1
“将阿拉伯语维基百科转换成命名实体分类法”是一个数据集,由4000条阿拉伯语维基百科文章分类为粗粒度NE分类法。 该数据集可用于与NER相关的文档分类任务。 要使用该语料库,请引用以下出版物:F. Alotaibi和M. Lee,“将阿拉伯维基百科映射到命名的实体分类法中”,《 COLING 2012年会议录:海报》,第43-52页,印度理工学院,印度孟买,12月8日。 -15。 2012年。作者URL:http://www.cs.bham.ac.uk/~fsa081/index.html http://fsalotaibi.kau.edu.sa电子邮件:fsalotaibi {AT} kau.edu.sa fsa081 {AT } cs.bham.ac.uk
2022-07-18 10:07:38 11.55MB 开源软件
1
英国邮政编码多边形 来自Wikipedia的KML和GeoJSON格式的英国邮政编码区域和区域多边形的转储 邮政编码区域? 地区? 请参阅《理想邮政编码》中的此。 这是什么? 从页面链接的KML文件的导出,也已转换为GeoJSON。 注意:每个GeoJSON文件代表一个邮政编码区域,并包含一个FeatureCollection ,每个组成邮政编码区域都具有一个Feature 。 例如: : 依存关系 从Wikipedia更新GeoJSON和KML文件需要togeojson和geojson-rewind ... sudo npm install -g @mapbox/togeojson sudo npm install -g @mapbox/geojson-rewind 或者 ... sudo yarn global add @mapbox/togeojson sudo ya
2022-06-09 10:48:34 4.01MB Shell
1
WikiExtractor 是一个Python脚本,可从中提取和清除文本。 该工具是用Python编写的,不需要Python 3,但没有其他库。 警告:由于Windows上的Python实现对StringIO支持不佳, StringIO在Windows上已报告问题。 有关更多信息,请参见 。 维基百科卷云提取器 cirrus-extractor.py是从Wikipedia Cirrus转储执行提取的脚本版本。 Cirrus转储包含带有已扩展模板的文本。 Cirrus转储位于: 。 细节 WikiExtractor通过预处理整个转储并提取模板定义来执行模板扩展。 为了加快处理速度: 多重处理用于并行处理文章 缓存中保留有已解析的模板(仅适用于重复提取)。 安装 该脚本可以直接调用: python -m wikiextractor.WikiExtractor <Wikipedi
2022-05-14 20:09:44 47KB Python
1
Create React App入门 该项目是通过引导的。 可用脚本 在项目目录中,可以运行: npm start 在开发模式下运行应用程序。 打开在浏览器中查看它。 如果您进行编辑,则页面将重新加载。 您还将在控制台中看到任何棉绒错误。 npm test 在交互式监视模式下启动测试运行器。 有关更多信息,请参见关于的部分。 npm run build 构建生产到应用程序build文件夹。 它在生产模式下正确捆绑了React,并优化了构建以获得最佳性能。 生成被最小化,并且文件名包括哈希值。 您的应用已准备好进行部署! 有关更多信息,请参见关于的部分。 npm run eject 注意:这是单向操作。 eject ,您将无法返回! 如果您对构建工具和配置选择不满意,则可以随时eject 。 此命令将从您的项目中删除单个生成依赖项。 相反,它将所有配置文件和传递性依赖项(w
2022-05-14 15:46:24 173KB JavaScript
1
wiki:设计类似Wikipedia的在线百科全书
2022-04-06 10:45:19 26KB Python
1
适用于Windows,Linux和MacOS的Voice Assistant Python应用程序 Возможностиприложения 使用Python 3和Windows以及Linux的Данныйпроектголосовогоассистента: 离线(распознаватьисинтезироватьречь)(бездоступакИнтернету); сообщатьопрогнозепогодывлюбойточкемира; производитьпоисковыйзапросвпоисковойсистемеGoogle YouTube上的производитьпоисковыйзапросвидеоиоткрыватьсписокрезультатовданногозапроса; Wikipedia cвыполнятьпоископределения; Wikipedia cдальнейшимпрочтениемпервыхдвухпредложений переводитьсизучаемогоязыканароднойязыкп
2021-12-23 17:53:04 22KB python macos linux youtube
1
作者: Ivan Bongiorni ,数据科学家。 卷积递归Seq2seq GAN用于时间序列数据中缺失值的插补 描述 该项目的目标是为时间序列数据的插补实现递归卷积Seq2seq神经网络的多种配置。 提供了三种实现: 循环卷积seq2seq模型。 基于上述相同体系结构的GAN (生成对抗网络),其中训练了Imputer来欺骗试图区分真实和假(推算)时间序列的对抗网络。 一种部分对抗的模型,其中先前模型的两种损失结构都组合在一个模型中:Imputer模型必须减少真实的错误损失,同时尝试欺骗鉴别器。 模型在TensorFlow 2中实现,并在数据集中进行了训练。 档案文件 config.yaml :用于数据预处理,培训和测试的配置参数。 管道: main_processing.py :启动数据预处理管道。 其结果是将准备好训练的数据集以.npy( numpy )格式保存在/da
2021-12-19 16:26:05 3.01MB python machine-learning tensorflow cnn
1
Wiki上的叉乘介绍
2021-11-25 15:02:24 435KB wikipedia CrossEntropy
1
WikiLink应用程序-Neo4j和Wikipedia图形可视化 什么是WikiLink? WikiLink是一个Web项目,可以在Wikipedia类别和页面URL之间创建的链接网络上进行更快的搜索和图形可视化。 WikiLink允许快速搜索其所有类别和页面URL,并在Wikipedia知识网络上查看它们的相关性。 还允许从开始的自定义类别或页面浏览图,找到它们之间的最短路径,或以图方式遍历给定类别的层次结构。 这次大探索旨在成为学习的一种补充方式。 堆 示例应用程序用作基础 -Neo4j Python驱动程序 基于Werkzeug,Jinja 2和良好意图的Python微框架。 Neo4j服务器 前端:jquery,bootstrap, ,pototo.js 设置 首先,使用设置,这样我们就不会破坏您计算机上拥有的其他Python东西。 如果要绕过创建virtualenv,则
2021-11-24 16:55:25 3.87MB JavaScript
1