1 概述

数据可视化无处不在,并且随着城市、交通、气象等数据容量和复杂性的与日俱增,大数据可视化的需求越来越大,成为人类对信息的一种新的阅读和理解方式。在GIS领域,通过大数据可视化手段进行数据分析,可以实现从秘密麻麻、错综复杂的数据挖掘信息,再通过可视化的方式展示出来,使读者对数据的空间分布模式、趋势、相关性和统计信息一目了然,而这些可能会在其他呈现方式下难以被发现。

大数据可视化可以做到实时,还可以根据地图比例尺的变化实时更新分析结果。目前,SuperMap的大数据可视化手段主要包括:热力图、网格聚合图。

精彩展示视频:
1、获取全球民航24小时实时数据,展现民航运输热度变化。

大数据可视化linux系统架构 大数据可视化技术_大数据


打开完整视频,来自优酷视频网


2、获取全球船只分布实时数据,通过网格聚合图展示船只分布特征和随时间变化情况。

大数据可视化linux系统架构 大数据可视化技术_大数据可视化linux系统架构_02

打开完整视频,来自优酷视频网


2 热力图

什么是热力图?热力图是通过色带渲染数据的各种程度信息,例如表达温度的高低程度、表达密度的疏密程度或者访问频度等,而这类信息使用原有的地图表现手法很难呈现出来。另外,随着大数据的使用,人们更需要从海量数据中快速提取有价值的信息,并通过可视化的手段直观展现,因此,热力图成为大数据可视化手段之一。

大数据可视化linux系统架构 大数据可视化技术_网格聚合_03

 

大数据可视化linux系统架构 大数据可视化技术_大数据可视化linux系统架构_04

某地图采样点的数据访问流量数据

如上图所示,某地图采样点的数据访问流量数据,单看秘密麻麻的点,很难发现其所反映的数据流量情况,不过,可以通过类似于核密度分析方法获得诸如热力图这种反映流量访问强度的态势图,然而对于大数据应用而言,往往要求更加快速实时,所以,热力图可以实现通过可视化手段完成分析结果的展现。

SuperMap 只针对点数据制作热力图,并生成热力图层。

热力图图层可以将对每个离散点建立缓冲区,然后,对每个离散点的缓冲区,使用渐进的灰度带(完整的灰度带是0~255)从内而外,由浅至深地填充;由于灰度值可以叠加(值越大颜色越亮,在灰度带中则显得越白。在实际中,可以选择ARGB模型中任一通道作为叠加灰度值),从而对于有缓冲区交叉的区域,可以叠加灰度值,因而缓冲区交叉的越多,灰度值越大,这块区域也就越“热”;以叠加后的灰度值为索引,从一条有256种颜色的色带中(例如彩虹色)映射颜色,并对图像重新着色,从而实现热力图。一般情况下,从冷色到暖色来显示热力图图层中的点密度状态。

热力图图层除了可以反映点要素的相对密度,还可以表示根据属性进行加权的点密度,以此考虑点本身的权重对于密度的贡献。

热力图图层将随地图放大或缩小而发生更改,是一种动态栅格表面,例如,绘制全国旅游景点的访问客流量的热力图,当放大地图后,该热力图就可以反映某省内或者局部地区的旅游景点访问客流量分布情况。

大数据可视化linux系统架构 大数据可视化技术_可视化_05

点数据(包含数据访问流量字段信息)

大数据可视化linux系统架构 大数据可视化技术_可视化_06

 

大数据可视化linux系统架构 大数据可视化技术_大数据_07

未设置点权重 设置了点权重

基于上述点数据制作热力图

大数据可视化linux系统架构 大数据可视化技术_热力图_08

放大地图比例尺后(设置了权重)

2.1 如何制作热力图

1. 选择数据并新建热力图层

SuperMap热力图只针对点数据制作热力图。不仅支持已有的UDB文件型数据源、数据库型数据源,还新增支持ES(Elasticsearch)数据,具有更高效的数据访问特点,满足大数据可视化应用。

大数据可视化linux系统架构 大数据可视化技术_大数据可视化linux系统架构_09

新建默认风格的热力图层

新建热力图层后,就可以通过一些设置参数调整热力图的显示效果,下文逐一介绍热力图的设置参数。

2. 设置核半径

核半径在热力图中所起的作用如下所述:

1) 热力图将根据设置的核半径值对每个离散点建立一个缓冲区。核半径数值的单位为:屏幕坐标

2) 对每个离散点建立缓冲区后,对每个离散点的缓冲区,使用渐进的灰度带(完整的灰度带是0~255)从内而外,由浅至深地填充;

3) 由于灰度值可以叠加(值越大颜色越亮,在灰度带中则显得越白。在实际中,可以选择ARGB模型中任一通道作为叠加灰度值),从而对于有缓冲区交叉的区域,可以叠加灰度值,因而缓冲区交叉的越多,灰度值越大,这块区域也就越“热”;

4) 以叠加后的灰度值为索引,从一条有256种颜色的色带中(例如彩虹色)映射颜色,并对图像重新着色,从而实现热力图。

3. 设置点的权重

上文所述,根据离散点缓冲区的叠加来确定热度分布密度,而权重则是确定了点对于密度的影响力,点的权重值确定了该点缓冲区对于密度的影响力,即如果点缓冲区原来的影响系数为1,点的权重值为10,则引入权重后,该点缓冲区的影响系数为1*10=10,以此类推其他离散点缓冲区的密度影响系数。

那么,引入权重后,将获得一个新的叠加后的灰度值为索引,在利用指定的色带为其着色,从而实现引入权重的热力图。

这里,通过指定一个字段作为权重,并且作为权重的字段必须为数值型字段。

4. 设置渲染色带

通过最大值颜色和最小值颜色构建一个色带,最大值颜色用来渲染热力图中灰度值最大的部分,也就是最热区域,最小值颜色用来渲染热力图中灰度值最小的部分,也就是最冷区域,以此类推来渲染热力图。

当地图开启Alpha时,还可以调整颜色的透明度,从而制作半透明效果的热力图,便于与底图数据叠加显示。

5. 调整色带渲染效果

1) 最值调整

通过最大值颜色和最小值颜色以及颜色的透明度可以最初完成热力图的渲染,不过用户还可以通过如下设置内容进一步微调热力图的颜色效果。

通过自定义最大值和最小值的方式调整热力图的最大值颜色和最小值颜色的分布。默认状态下,系统会基于当前地图比例尺计算热力图的一个默认最大值和最小值(系统最大值和最小值将根据地图比例尺的变化而发生变化。),然后,按照最大值对应用户设置的最大值颜色,最小值对应最小值颜色的关系构建渲染色带,对热力图进行色彩渲染。

当用户自定义了最大值和最小值,那么最大值仍旧对应用户设置的最大值颜色,最小值仍旧对应最小值颜色的关系构建渲染色带,而其他大于最大值的部分将以最大值颜色渲染,小于最小值的部分将以最小值颜色渲染。

大数据可视化linux系统架构 大数据可视化技术_网格聚合_10

大数据可视化linux系统架构 大数据可视化技术_可视化_11

 

大数据可视化linux系统架构 大数据可视化技术_可视化_12

使用系统默认最值[0,35] 自定义最值[5,16]

2) 强度和模糊度调整

您还可以通过强度和模糊度这两项进一步调整热力图的颜色效果。

a) 强度可以调整最大值颜色和最小值颜色确定的渐变色带中最大值颜色所占的比重,也就是最大颜色权重,该值越大,表示在色带中最大值颜色所占比重越大。

b) 模糊度(颜色渐变模糊度)主要调整热力图中颜色渐变的模糊程度。

大数据可视化linux系统架构 大数据可视化技术_热力图_13

 

大数据可视化linux系统架构 大数据可视化技术_大数据可视化linux系统架构_14

最大颜色权重0(其他设置同右图) 颜色权重30(其他设置同左图)

大数据可视化linux系统架构 大数据可视化技术_网格聚合_15

 

大数据可视化linux系统架构 大数据可视化技术_可视化_16

颜色渐变模糊度25(其他设置同右图) 颜色渐变模糊度40(其他设置同左图)

6. 更新热力图

当制作热力图的点数据发生变化时,热力图层不会自动随之更新,需要用户调用数据刷新的操作实现更新。



大数据可视化linux系统架构 大数据可视化技术_网格聚合_17





3 网格聚合图

什么是网格聚合图?网格聚合图简单说就是一种使用空间聚合方法,表现空间数据的分布特征和统计特征。它的基本原理是基于网格聚合算法,将空间区域划分为规则形状的网格单元,每个网格单元又划分为多个层次,高层次的网格单元被分为多个低层次的网格单元,每个网格单元都具有统计信息。

大数据可视化linux系统架构 大数据可视化技术_可视化_18

矩形网格聚合图

大数据可视化linux系统架构 大数据可视化技术_可视化_19

六边形网格聚合图

SuperMap支持对空间点数据构建网格聚合图,并且提供了两种形状的网格进行聚合显示,一种是矩形网格,一种是六边形网格。通过网格对地图点要素进行网格划分,然后,计算每个网格单元内点要素的数量,并作为网格的统计值,也可以引入点的权重信息,考虑网格单元内点的加权值作为网格的统计值;最后基于网格单元的统计值,按照统计值大小排序的结果,通过色带对网格单元进行色彩填充。

大数据可视化linux系统架构 大数据可视化技术_大数据_20

 

大数据可视化linux系统架构 大数据可视化技术_热力图_21

 

大数据可视化linux系统架构 大数据可视化技术_大数据_22

通过格网统计格网内的点数目

一幅完整的网格聚合图包含以下几个要素:

1) 网格:每个网格单元为一致大小的格网,可以为矩形或者六边形,并且地图比例尺的变化,网格单元的大小固定不变;网格用来统计落入每个网格单元内的点对象数目。

2) 标签:每个网格中心具有一个标签,该标签为网格单元的统计值,该统计值可以是落入每个网格单元内的点对象数目,也可以是落入每个网格单元内的点的加权值。

3) 网格渲染风格:网格单元的填充颜色表示网格统计值的分布趋势,其颜色由深到浅,表示网格单元的值从大到小。另外,还可以设置网格矩形边框的风格。

3.1 如何制作网格聚合图

1. 选择数据并新建网格聚合图层

SuperMap热力图只针对点数据制作网格聚合图。不仅支持已有的UDB文件型数据源、数据库型数据源,还新增支持ES(Elasticsearch)数据,具有更高效的数据访问特点,满足大数据可视化应用。

大数据可视化linux系统架构 大数据可视化技术_大数据_23

访问ES数据制作网格聚合图

大数据可视化linux系统架构 大数据可视化技术_大数据可视化linux系统架构_24

新建默认风格的网格聚合图层

新建网格聚合图层后,就可以通过一些设置参数调整网格聚合图的显示效果,下文逐一介绍网格聚合图的设置参数。

2. 设置格网类型

SuperMap提供了两种形状的网格进行聚合显示,一种是矩形网格,一种是六边形网格。根据制图需要选择合适的格网类型。

大数据可视化linux系统架构 大数据可视化技术_大数据_25

 

大数据可视化linux系统架构 大数据可视化技术_可视化_26

矩形格网 六边形格网

3. 设置格网字段

格网字段可以不指定,此时,网格聚合图每个格网单元的统计值默认为落在该单元格内的点对象数目;如果指定了一个格网字段,那么该字段值将作为点的权重信息,此时,网格聚合图每个格网单元的统计值为落在该单元格内的点的加权值。另外,所指定格网字段必须为数值型字段。

 

大数据可视化linux系统架构 大数据可视化技术_可视化_27

 

大数据可视化linux系统架构 大数据可视化技术_大数据_28

未指定格网字段 数据流量作为格网字段

6. 设置渲染色带

通过最大值颜色和最小值颜色构建一个渐变色带,最大值颜色用来渲染网格聚合图中统计值最大格网单元,最小值颜色用来渲染网格聚合图中统计值最小格网单元,其他格网单元使用渐变色带中的其他颜色渲染,并遵循统计值越大渲染颜色越靠近色带中的最大值颜色一端。

当地图开启Alpha时,还可以调整颜色的透明度,从而制作半透明效果的网格聚合图,便于与底图数据叠加显示。

大数据可视化linux系统架构 大数据可视化技术_可视化_29

7. 设置格网风格

网格聚合图的格网风格主要包含以下几方面:

1) 格网大小:设置格网单元大小,对于六边形格网,通过指定边长来确定大小;对于矩形格网,通过指定长度和宽度来确定格网大小。数值单位为:屏幕坐标。

2) 格网边框:A)设置网格单元矩形边框线的线型,有三种情况:无边框、实线边框、虚线边框。B)设置边框线宽度。C)设置边框线颜色,并支持半透明效果设置。

3) 格网标签:设置网格单元内统计值标签的风格。

大数据可视化linux系统架构 大数据可视化技术_大数据_30

格网标签风格设置(来自iDesktop截图)

大数据可视化linux系统架构 大数据可视化技术_大数据_31

矩形网格聚合图参数设置(来自iDesktop截图)

6. 更新热力图

当制作热力图的点数据发生变化时,热力图层不会自动随之更新,需要用户调用数据刷新的操作实现更新。



大数据可视化linux系统架构 大数据可视化技术_可视化_32