目录: (1)H3Cloud Workspace (2)H3Cloud Workspace/VDI终端 (3)UIS超融合 (4)CAS
2022-04-08 14:07:23 302.84MB H3C 云计算
C\C++基于WinSock2编写的PING程序,每一行我都注释了代码作用,很完整 复制粘贴即可使用
2022-04-08 14:05:10 22KB c++ icmp 网络排错
1
今天小编就为大家分享一篇python 实现倒索引的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
2022-04-07 16:34:33 28KB python 倒排 索引
1
项目1 一个使用倒索引和向量空间模型的简单信息检索项目。 1)源代码只是一个python文件ir.py。 2)代码是用Python 2.7编写的。 3)代码中的query_file和base_dir变量要分别设置为query文件和blogs目录。 4)查询文件格式为:企鹅851 March每行一个查询,不带引号。 5)每个实现的IR模型都有一个后缀(名称)。 TFIDF:'stem' LogtfIDF:'stem-logtf' TFIDF-Positional:'stem-positional' BM25:'stem-bm25' 语言模型:'stem-lm' 拉普拉斯平滑语言模型:'stem-lmls' 为了对两个模型的两个分数进行线性求和,可以将 main(methods) 中的方法设置为我们打算在最终结果中使用的后缀列表。 例如 main(methods=['stem'
2022-04-07 13:36:29 117KB Python
1
Android应用源码开发Demo,主要用于毕业设计学习。
2022-04-07 09:06:13 7.59MB Android 毕业设计 源码 论文
目前内容只支持单单列,也可根据自己需求添加多多列,目前暂时没时间支持那么多
2022-04-06 19:05:25 3KB unity3d
1
unity ugui 图文混
2022-04-06 14:23:13 4KB unity ugui 图文混排
1
详细描述华为视讯SC系统日志常用错步骤。
2022-04-06 14:08:40 1.96MB 华为
1
Android应用源码开发Demo,主要用于毕业设计学习。
2022-04-06 11:04:05 13.48MB Android 源码 毕业设计 论文
财经新闻搜索引擎 从财经新闻网页数据开始,进行正文提取、中文分词、倒索引构建、执行搜索和UI。 要求技术:MapReduce或Spark;执行搜索和UI采用Spark或Java 步骤: (1)新闻正文提取,采用正则表达式提取指定网站栏目新闻的标题、正文和发表时间。 评分标准:一个栏目15分(多一个栏目+5分)(25分);使用通用算法提取不固定格式正文(不算很难)40分 (2)中文分词(worldcount),将正文进行中文分词,保存每个新闻的URL、标题、正文等数据 评分标准:分词并将正文存储到文件15分;存储到HBase(本地)+5分 (3)倒索引构建,将词汇、次数和文章ID构建成倒索引和对应的TF值 评分标准:计算倒索引并存储到文本文件15分;存储到HBase(本地)+5分;计算TF值5分 (4)执行搜索,对用户搜索词进行分词,从倒索引读取对应词汇,读取TF值,读取数据计算IDF值,根据IF×IDF值对词汇对应的文章进行序,显示序后的正文摘要 评分标准:25分,有交互式UI(如网页)+10分 (5)优化和执行 评分标准:shuffle优化并做对比测试+10分;第(2)
2022-04-06 02:48:23 6.88MB 搜索引擎 spark 中文分词 大数据