搜索引擎的整体框架是怎样的?包含哪些核心技术?· 网络爬虫的基本架构是什么?常见的爬取策略是什么?什么是暗网爬取?如何构建分布式爬虫?百度的阿拉丁计划是什么?· 什么是倒排索引?如何对倒排索引进行数据压缩?· 搜索引擎如何对搜索结果排序?· 什么是向量空间模型?什么是概率模型?什么是BM25模型?什么是机器学习排序?它们之间有何异同?· PageRank和HITS算法是什么关系?有何异同?SALSA算法是什么?Hilltop算法又是什么?各种链接分析算法之间是什么关系?· 如何识别搜索用户的真实搜索意图?用户搜索目的可以分为几类?什么是点击图?什么是查询会话?......
2022-11-15 17:26:02 5.45MB 搜索引擎
1
这就是搜索引擎:核心技术讲解封面 这本书我没有看完,只看了前面两个对SEO影响比较大的章节,就是搜索引擎的爬虫系统和倒排索引的知识。 说的都是些纯理论,但是对于SEOer来着,这些都是不可或缺的知识面,看似对于SEO工作没有任何作用,但是实际上可以从中理解了很多SEO的常识,让你知道SEO为什么要这样做,比如, 你知道为什么网站要增加关键词密度吗? 你知道为什么发外链为什么要用锚文本吗? 你知道索引和收录到底什么区别吗? 很多SEO常识,你能够从这本书找到答案。SEO,不能单纯的去做优化工作,要知其然,也要知其所以然。
2021-12-26 09:56:52 33.44MB 搜索引擎 核心技术 张俊林 知识图谱
1
iOS平台应用详解:《Siri:I,robot! Siri语音识别系统详解》 | iOS DevCamp 话题简介:Siri是苹果公司发布的广受关注的iOS平台应用,它不仅仅是一套语音识别系统,更重要的是其用户意图分析与智能识别机制。本讲座将深入分析Siri的技术原理,讲解其系统架构、语音识别系统、活跃本体、执行系统、服务系统以及输出系统等重要构成模块,使大家了解如何构造类似的智能应用。 讲师介绍:张俊林,中科院软件所博士、《这就是搜索引擎:核心技术详解》作者,现为新浪微博研发人员,从事自然语言处理、搜索技术、推荐系统以及机器学习方面的研发工作。
2021-10-30 11:35:26 1.76MB DevCamp iOS Siri 语音识别
1