近年来,随着信息技术,计算机技术及互联网的快速发展,各个
社会领域均积累起了规模庞大的数据。随着信息系统的广泛应用,源
自古老的数据分析及统计技术,加上现代的人工智能,数据库和统计
学相关技术,研究如何充分利用大规模的数据,发掘出有用知识的数
据挖掘技术迅速发展起来。
机器学习是解决数据挖掘问题的主要方法之一。机器学习是一种
利用系统本身进行自我改进的过程,使计算机程序能随着经验的积累
自动提高性能,虽然到目前为止机器学习还不足以使计算机具备和人
类一样强大的学习能力,但针对大量特定学习任务的算法的提出,使
计算机具备了从大量数据中提取特征、发现隐含规律的能力,因此机
器学习在数据挖掘中得到了广泛应用。
本文针对两个具体的数据挖掘问题提出了基于机器学习算法的
解决方案:第一个问题为利用大量路测的移动终端接收电平信号数据
对GSM网络户外移动终端进行定位,针对这一问题,本文在过往成
果的基础上提出一种基于支持向量机和k-近邻法的三阶段定位方法,
该方法相对于以往基于机器学习的定位方法大幅提高了定位精度和
定位速度。第二个问题为利用大量用户数据对新浪微博这一特定社交
网络中的用户联系进行预