面向维基百科多模态数据的知识抽取方法之计算机研究.docx
2021-10-12 11:03:14 84KB C语言
自述文件 该自述文件通常会记录启动和运行应用程序所需的所有步骤。 您可能要讲的内容: Ruby版本 系统依赖 配置 数据库创建 数据库初始化 如何运行测试套件 服务(作业队列,缓存服务器,搜索引擎等) 部署说明 ...
2021-09-22 17:42:09 181KB Ruby
1
维基百科上对欧拉角的简介,全英文
2021-08-18 18:07:22 1.15MB 维基百科 欧拉角
1
Encoding Knowledge Graph Entity Aliases in Attentive Neural Network for Wikidata Entity Linking
维基百科中文离线包zim格式,wikipedia_zh_all_maxi_2020-05.zim,使用kiwi打开
2021-07-15 10:08:05 82KB 维基百科
1
sk-维基百科 一个为维基百科提供 node JS API 的开放项目 要安装,只需执行 npm install sk-wikipedia 它只是一个小项目,阅读 index.js。 你会得到的 ;)
2021-07-08 14:06:02 3KB JavaScript
1
ToP4CAS 协作创作系统的来源追踪器 “top4cas.jar”提取每个令牌在最新版本中的作者身份数据,用于修订的基于文本的内容。 “Test.java”是使用 Top4cas 的示例代码。 Top4cas 是一个系统,用于识别为每个版本管理的合着内容中每个词的来源。例如,通过提供维基百科文章每个版本的数据(将文本分成词的词和该版本的编辑者)作为输入,谁在文章最终版本的正文中撰写了每个描述以及何时。在单词级别输出。您还可以获取有关编辑者在哪个版本中添加了哪些词,以及哪些词是由谁编写并删除、保留或恢复的数据。具体执行示例程序Test.java。
2021-07-06 17:07:01 37KB Java
1
DocumentAnalysis Wikipedia document analysis using Hadoop Map的每个输入是XML文档的 标签到 标签。其中key没有意义,value就是这两个标签(包括标签本身)的值,可以通过 .toString() 方法转化为字符串进行下一步处理 src/documentParser TextParser.java 正则表达式处理String,能够去除大部分标点符号,需要补全 XMLHandler.java SAX流形式处理XML格式的字符串
2021-07-06 17:06:49 84KB Java
1
易读 自定义 JS/CSS 使维基百科页面更易于阅读。 如果您有注册的 Wikipedia 帐户,则可以通过将其复制到您的自定义 JS/CSS 文件来使用它。 请注意,这仅适用于默认的 Vector 皮肤——它需要对任何其他皮肤进行认真的调整。 ##安装 将 JS 文件的内容复制到您的。 将 CSS 文件的内容复制到您的 。 。
2021-07-03 18:03:37 2KB wikipedia CSS
1
一个简单的 Python 维基百科爬虫。 运行: celery worker -A crawler.tasks --loglevel=info -Q fetch_queue -n 'fetcher' celery worker -A crawler.tasks --loglevel=info -Q parse_queue -n 'parser' 用于监控:celery -A crawler.tasks 花 --broker=amqp://guest:guest@localhost:5672// --broker_api=http://guest:guest@localhost:15672/api/ rabbitmq-plugins 启用 rabbitmq_management 花: RabbitMQ: 为什么只有维基百科 => 几乎可以保证健全的 HTML
2021-06-29 19:23:50 4KB Python
1