随着计算机技术、物联网技术和现代智能终端技术的发展,大数据时代已经到来。大到企业、政府、媒体部门,小到个人,每天都在进行"读读"。各种各样的复杂数据和信息充斥着人们的眼球。这就需要一种有效的方法从海量信息中提取有用的信息,并能立即产生一定的相关结果,供决策者做出正确的决策。
一、关于数据可视化
数据可视化,是关于数据视觉表现形式的科学技术研究。其主要目的是借助图形手段,清晰、有效地进行传达与沟通信息,其中,数据的可视化表示被定义为一种以某种形式提取的信息,包括相应信息单元的各种属性和变量。数据可视化技术包含以下几个基本概念:
1、数据可视化
数据可视化是指将大型数据集中的数据以图形图像形式表示,并利用数据分析和开发工具发现其中未知信息的处理过程。
2、数据分析
数据分析指对多维数据进行切片、块、旋转等动作剖析数据,从而能多角度多侧面观察数据。
3、数据开发
数据开发是指利用一定的算法和工具对数据进行定量的推演和计算。
4、数据空间
数据空间是由n维属性和m个元素组成的数据集所构成的多维信息空间。
二、数据可视化的作用
1、数据分析:是通过计算机获得多维、多源、异构和海量数据所隐含信息的核心手段,它是数据存储、数据转换、数据计算和数据可视化的综合应用。
2、数据表达:是通过计算机图形技术来更加友好地显示数据信息,以便人们理解和分析数据。
3、数据操作:是以计算机提供界面、接口和协议等条件为基础完成人与数据的交互需求,数据操作需要友好便捷的人机交互技术、标准化的接口和通信协议来完成对数据集的操作。
三、大数据可视化的实施步骤
1、需求分析
需求分析是大数据可视化项目开展的前提,要描述项目背景与目的、业务目标、业务范围、业务需求和功能需求等内容,明确实施单位对可视化的期望和需求。包括需要分析的主题、各主题可能查看的角度、需要发泄企业各方面的规律、用户的需求等内容。
2、建设数据仓库/数据集市的模型
数据仓库/数据集市的模型是在需求分析的基础上建立起来的。数据仓库/数据集市建模除了数据库的ER建模和关系建模,还包括专门针对数据仓库的维度建模技术。
3、数据抽取、清洗、转换、加载(ETL)
数据抽取是指将数据仓库/集市需要的数据从各个业
务系统中抽离出来,因为每个业务系统的数据质量不同,所以要对每个数据源建立不同的抽取程序,每个数据抽取流程都需要使用接口将元数据传送到清洗和转换阶段。
4、建立可视化场景
建立可视化场景是对数据仓库/集市中的数据进行分析处理的成果,用户能够借此从多个角度查看企业/单位的运营状况,按照不同的主题和方式探查企业/单位业务内容的核心数据,从而作出更精准的预测和判断。