大数据面临数据规模大、数据变化快、数据类型多、价值密度低4个挑战,而传统的数据可视化工具难以应对。传统的数据可视化工具仅仅将数据加以组合,通过不同的展现方式提供给用户,用于发现数据之间的关联信息。近年来,随着云和大数据时代的来临,数据可视化产品已经不再满足于使用传统的数据可视化工具来对数据仓库中的数据抽取、归纳并简单的展现。新型的数据可视化产品必须满足互联网爆发的大数据需求,必须快速的收集、筛选、分析、归纳、展现决策者所需要的信息,并根据新增的数据进行实时更新。因此,在大数据时代,数据可视化工具必须具有以下特性:
(1)实时性:数据可视化工具必须适应大数据时代数据量的爆炸式增长需求,必须快速的收集分析数据、并对数据信息进行实时更新;
(2)简单操作:数据可视化工具满足快速开发、易于操作的特性,能满足互联网时代信息多变的特点;
(3)更丰富的展现:数据可视化工具需具有更丰富的展现方式,能充分满足数据展现的多维度要求;
(4)多种数据集成支持方式:数据的来源不仅仅局限于数据库,数据可视化工具将支持团队协作数据、数据仓库、文本等多种方式,并能够通过互联网进行展现。
下面列举一些常用的大数据可视化工具,如下表所示:
开源工具 | 商业工具 |
---|---|
Processing | Tableau |
Many Eyes | Spotfire(TIBCO) |
D3.js | QlikView |
R(基础包、lattice、ggplot2) | FineBI |
ECharts | SAS Visual Analytics |
Google Charts | Adobe Illustrator |
Flot | HighCharts |
Gephi | iCharts |
Envision.js | Jolicharts |
Prefuse | Dundas Chart |
Arbor.js | LightningChart |
Chart.js | Microsoft Excel |
Paper.js | |
NodeBox |
Processing是一个开源的编程语言和编程环境,可运行在GNU/Linux、Mac OS X、Windows 上。是为数字艺术家创造的可视化和绘图软件,它通过封装底层的图形操作,使得可视化和绘图细节对用户透明;Many Eyes是由IBM公司开发的在线可视化平台,用户可以上传自己的数据并创建交互式可视化作品。Many Eyestigongle 6大类,19个小类可视化类型及其应用原则,涵盖了从统计数据、文本到地理信息的多种数据。每一类都有详细专业的说明帮助用户进一步了解可视化类型;D3.js是一个基于数据处理文档的JavaScript库,被设计成基于数据绑定的直接对DOM文档进行修改的可视化工具,D3本身关注转换(Transformation),而不是表达(Representation)。D3大致包含四个部分:选择器,数据捆绑,交互与动画以及常用模块;R是一门主要用来进行数据统计、计算和绘图的编程语言,内建多种统计学及数字分析功能;ECharts是基于Canvas的纯Javascript的图表库,提供直观,生动,可交互,可个性化定制的数据可视化图表,此外还有Google Charts、Flot、Gephi、Envision.js、Prefuse、Arbor.js、Chart.js、Paper.js、NodeBox等等,都是一些比较优秀的图表库。
就商业工具来说,Tableau、Spotfire(TIBCO)、FineBI、SAS Visual Analytics、Adobe Illustrator、QlikView既是数据可视化工具又是交互式的商业智能(BI)工具;HighCharts、iCharts、Jolicharts、Dundas Chart、LightningChart等都是商用收费的图表库。