维基百科语料库直接解压使用即可
2021-12-17 09:09:02 197.92MB 维基百科
1
维基利亚密码分析程序流程图
2021-12-10 14:05:58 147KB 维基利亚密码分析程序流程图
1
维基百科中文语料库,是自然语言处理中常用的一个数据集,里面包含了大量的中文词条,本文件是2020年7月份最新的语料(2)。
2021-12-09 16:40:56 202.99MB 维基百科 中文语料库 数据集
1
wiki_idf 维基百科数据的idf值,详情可以参见tfidf介绍, idf为逆文档频率,可以用来衡量词语的常见或罕见程度,可以在特定领域进行关键词抽取,然后通过idf值进行过滤
2021-12-07 10:46:26 73.62MB 机器学习
1
用于BERT预训练,Bidirectional Encoder Representation from Transformers
2021-12-02 19:41:40 489.93MB BERT
1
ScrewTurn Wiki 维基 是使用 ASP.NET 和 C# 创建的一个开源 wiki系统。默认情况下,ScrewTurn Wiki 的页面、修改历史记录和用户帐户均以文本文件保存,这意味着 wiki 不需要数据库,只需将 ScrewTurn Wiki 程序复制到 Web 服务器就完成部署。此外ScrewTurn Wiki 还提供了MS SQL Server 和 MySQL 的DataProvider,当然您也可以实现自己的DataProvider,因为ScrewTurnWiki预留相应的Plugin接口。从3.0版 本开始,ScrewTurnWiki的源代码使用VS2008以WebApplication项目进行开发,因此进行代码修改更加方便。ScrewTurn Wiki 维基系统 主要功能:免费开源 无需使用一个数据库 (但是由SQL Server 和 MySQL 方面插件支持) 无需接触 IIS 和 ASP.NET 配置 (在 ASP.NET Medium Trust 环境下工作)  一个灵巧的可配置内容缓存系统促使其性能卓越和每个硬件配置均可扩展 可配置的ViewStat
2021-11-30 16:20:44 7.6MB .net源码
1
维基百科PageRank 世界上最简单的维基百科爬虫和页面排名器。 要抓取一组页面并创建图表: String[] searchTerms = {"term1", "term2"}; int max_nodes = 1000; String outputFileName = "file_name.txt" WikiCrawler w = new WikiCrawler("/wiki/title_of_start_page", searchTerms, max_nodes, outputFileName); w.crawl(); 计算上图的页面排名: double eps = 0.05; //pagerank convergence criteria PageRank p = new PageRank(outputFileName, eps); String[] top100 =
2021-10-29 08:14:05 8KB Java
1
LZMA算法是目前比较流行的开源压缩软件7zip的基本算法,是俄罗斯人 Igor Pavlov于1999年发布的,本资源是维基百科上的详细介绍,是网上能找到的最详细的一个说明。
2021-10-13 19:08:00 96KB LZMA LZ77 区间编码 动态规划
1
面向维基百科多模态数据的知识抽取方法之计算机研究.docx
2021-10-12 11:03:14 84KB C语言
自述文件 该自述文件通常会记录启动和运行应用程序所需的所有步骤。 您可能要讲的内容: Ruby版本 系统依赖 配置 数据库创建 数据库初始化 如何运行测试套件 服务(作业队列,缓存服务器,搜索引擎等) 部署说明 ...
2021-09-22 17:42:09 181KB Ruby
1