基于大数据的空气质量数据可视化 作者:武 装 覃爱明 来源:《中外企业家·下半月》 2015年第1期 武 装 覃爱明 (首都经济贸易大学,北京 100070) 摘 要:近一个世纪以来,由于工业化、城市化的飞速发展、人类活动的加剧造成了世界性的能源、交通规模的持续扩大,城市人口的急剧膨胀,各类生产活动和生活中所产生的大量有害物质被排放到空气中,改变了空气的组成成分,形成了空气污染。空气污染是世界和中国大多数工业城市所面临的最为严重的环境问题。开展空气质量监测、数据分析与可视化的研究可以全面掌握城市空气污染源的排放数据和各种空气污染物在不同空间区域内的浓度数据,可以对影响城市空气质量的因素有所了解和把握。本文提出了利用空气污染观测资料和先进的大数据Hadoop平台,对空气监测数据进行数据挖掘和分析的思路,依据逐年逐日的天气现象数据,针对地区空气污染状况以及时间分布特征的影响进行研究,并以可视化的方法对空气污染物的时空分布特征与预测进行探讨。 关键词:大数据;可视化;空气质量;监测 中图分类号:N37 文献标志码:A 文章编号:1000-8772-(2015)03-0249-03 收稿日期:2015-01-19 基金项目:北京市哲学社会科学规划项目(14SHB015);北京市教育委员会社会科学研究计划项目(SM201410038013);首都经济贸易大学高等教育研究项目(项目名称:我校科研团队成长性及水平评价研究);北京市属高等学校高层次人才引进与培养计划项目(项目名称: 非完备信息系统中决策树生成算法及其优化研究)。 作者简介:武装(1970-),男,河北唐山人,博士,副教授。研究方向:大数据,可视化。 一、引言 空气污染对人类及其生存环境造成的危害与影响,已逐渐为人们所认识。近年来中国地区空气污染加剧,其中雾霾污染正演变成为城市大气污染的主要表现之一,引起了普通民众和科学界的广泛关注。空气污染对城市居民的健康风险、由此造成的经济损失以及对居民的健康影响都是不可估量的。空气污染主要通过三条途径危害人体:一是人体表面接触后受到伤害,二是食用含有大气污染物的食物和水中毒,三是吸入污染的空气后患上种种严重的疾病。不仅如此,空气污染危害生物的生存和发育,大气污染物对仪器、设备和建筑物等,都有腐蚀作用,空气污染还造成臭氧层破坏、酸雨腐蚀和全球气候变暖[1]。世界卫生组织和联合国环境组织发表的一份报告指出:"空气污染已成为全世界城市居民生活中一个无法逃避的现实。"如果人类生活在污染十分严重的空气里,那就将在几分钟内全部死亡。工业文明和城市发展,在为人类创造巨大财富的同时,也把数十亿吨计的废气和废物排入大气之中,人类赖以生存的大气圈成了空中垃圾库和毒气库。因此,大气中的有害气体和污染物达到一定浓度时,就会对人类和环境带来巨大灾难。 基于大数据的空气质量数据可视化全文共5页,当前为第1页。 自从计算机开始应用于可视化技术以后,人们发现了许多新颖的可视化技术,现有的技术也得到了改进。新技术和新平台的出现,使可视化技术可以实现用户与可视化数据之间的交互,从采集分析数据到呈现数据可视化也实现了一体化。中国近几十年来经济发展迅速,矿物能源大量消耗以及环境保护措施的欠缺,导致中国许多地区发生了严重的空气污染和水污染。空气污染是一个非常复杂的系统问题,它不仅涉及到人为与自然排放,同时也要考虑到当地气象以及区域气候条件的影响。大数据时代的来临,促进了更加智能的数据可视化工具的出现,云计算和虚拟化技术的不断发展使得大数据在应用层面更加丰富,再加以数据可视化,这样的大数据分析才更有意义,效率也才会更高。本文提出了以大数据分析为基础的空气质量数据可视化思路,对掌握城市空气质量在时间和空间维的变化发展趋势,对污染控制、环境管理和公共事业发展均有一定的理论意义与实用价值。 基于大数据的空气质量数据可视化全文共5页,当前为第1页。 二、大数据 (一)大数据的特征 大数据是一个体量特别大,数据类别特别大,超过传统数据库系统处理能力的数据集。大数据首先是指数据体量(volume)大,指大型数据集,至少在10TB规模以上,一般达到PB级的数据量;其次是指数据类别(variety)大,数据来自多种数据源,数据种类和格式包括了半结构化和非结构化数据;接着是数据处理速度(velocity)快,在数据量非常庞大的情况下,也能够做到数据的实时处理;最后一个特点是指数据真实性(veracity)高,比如社交数据、企业内容、交易与应用数据等新数据源。 3V是大数据时代的显著特征,这些特征正在给现在的IT企业带来巨大挑战。大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化信息资产。 (二)基于Hadoop的大数据分析技术 Hadoop是一个能够对大量数
2023-02-19 13:27:20
173KB
文档资料
1