上传者: 26713059
|
上传时间: 2025-04-21 00:22:28
|
文件大小: 1.58MB
|
文件类型: PDF
3.1 需求分析
需求分析是任何一个项目开发过程中的一个决定性环节,一份完整好的需求分
析,开发者可以准确的熟悉整个软件或者系统的功能,要求,设计条件等具体要求,
进而确定项目要去完成的具体模块。需求分析对整个开发国政具有决定性,是项目
做好,高质的重要保证。
3.1.1 开发背景及目标
本文的数据来源于校园区域内学生上网搜狗搜索日志,每条日志通常都代表一
个学生的访问行为,本位所使用的数据是搜狗一天内的 500 万条搜索日志记录,其
格式为:访问时间,用户 ID,查询词,该 URL 在返回结果中的排名,点击顺序号,
点击 URl。
其中用户 ID 是根据用户使用浏览器访问搜索引擎的自动复制,同一次使用浏
览器输入的不同查询词对应于同一 ID。五条用户查询记录如表 3.1 所示:
表 3.1 用户查询记录
访问时间 用户 ID 查询词 返回结果
排名
点击顺
序号
点击 URL
2011123000
0005
f31f594bd1f31472
98bd952ba35de84d
傲视千雄 3 1 http://web.
4399.com
2011123000
0017
2ebbc38bf56753b0
9c945de813a443c3
人在囧途 2 1 http://tv.s
ogou.com
2011123000
0020
072fa3643c91b29b
d586aff29b402161
12306.cn 1 1 http://www.
12306.cn
2011123000
0016
16c3b69cc93e838f
89895b49643cef1d
王小丫 6 1 http://www.
94caobi.com
2011123000
0018
3d1acc7235374d53
1de1ca885df5e711
满江红 2 2 http://www.
baidu.com
从上面的这几条日志中,我们可以得到很多有价值的信息,例如搜索者的 ID、
访问的时间、查询的关键词、点击的 URL 等。 毫无疑问,搜狗搜索日志中包含了