# D# ~% c4 R2 C; W 大数据时代,数据驱动决策。处理不好庞大、复杂的数据,其价值将大打折扣。
" F& Q. y. H4 } q" [3 }* `( y$ r
可以想象一本没有图片的教科书。没有图表、图形或是带有箭头和标签的插图或流程图,那么这门学科将变得更加难以理解。人类天生就是视觉动物,而视觉效果对于分析数据、传达实验结果甚至做出惊人的发现至关重要。
/ m' F# @0 l9 E7 H3 Z
工作中我们可能会接触到很多业务数据,需要在总结汇报中展示呈现,俗话说“字不如表,表不如图”,那么如何缩短数据与用户的距离?让用户一眼Get到重点?让老板赞同你的汇报方案呢?
) k% X. I! V3 j( U* B) p2 b: P 『《大西洋古抄本》是达芬奇的手稿集册中最大的一部,共 12 卷,1119 张,年代分布为 1478 年到 1519 年。每个方块代表一页手稿,上面的颜色代表涉及的主题,包括几何与代数、物理学与自然科学、工具和机器、建筑与应用艺术和人文科学。点开每一个小方块还可以看到每一页上面达芬奇写了什么,涉及了 36 个小话题,包括了马、食谱、绘画、灵魂、童话故事、笑话等很多有意思的小话题。』
* S/ K. Q8 e( c / b+ P/ r7 U' O& Y# V- V
是这样的么?
5 y" u( F0 y. M% n3 K" C, U
这样炫酷的数据可视化,小编真的不会。开个玩笑,其实工作中我们并不需要作出很炫酷的视觉呈现,数据可视化主要旨在借助于图形化手段,清晰有效地传达与沟通信息,有效地传达思想概念,美学形式与功能需要齐头并进,通过直观地传达关键的方面与特征,从而实现对于相当稀疏而又复杂的数据集的深入洞察。因此在设计过程中,每一个选择,最终都应落脚于读者的体验,而非图表制作者个人。
" Z2 v6 a0 o3 J0 Y
你不得不注意的图表制作小技巧
, k! ~1 H" E5 W3 g
条形图的基线必须从零开始
2 v! Z4 D2 J, @
Y轴不从零开始,可以使数据看起来具有比实际存在的更大的差距。这使得可视化会误导传输信息。条形图的原理就是通过比较条块的长度来比较值的大小。当基线被改变了,视觉效果也就扭曲了。
1 P* [& E7 C5 K0 o! n4 L7 [
6 I8 C; ^4 R/ T8 Y 使用简单易读的字体
# O u2 I; [" |4 y, E5 {1 e
有些时候,排版可以提升视觉效果,增加额外的情感和洞察力。但数据可视化不包括在内。坚持使用简单的无衬线字体(通常是Excel等程序中的默认字体)。无衬线字体即是那些文字边缘没有小脚的字体。字体选择可以影响文本的易读性,增强或减损预期的含义。因此,最好避免艺术字体并坚持使用更基本的常用字体。
/ ]0 w# {' G( j& S9 Q& t" T - C1 c, s9 r- W& P
/ n- y4 k& {# e, g; j9 r# ~ 打开凤凰新闻,查看更多高清图片
0 M2 `/ M& F# f; J' b5 U' ~ 9 E+ J' D' V3 V5 q% H
& o- a3 N1 z* I' J l# d( k 条状图宽度适度
" K6 F* r5 f6 t0 f& g7 a
条形图之间的间隔应该是1/2栏宽度。
8 k4 f5 k0 _$ s$ D# f/ Z) N . R, ~7 r, f# A' z6 t6 G
使用2D图形
& l9 l8 {3 @+ W1 L
虽然他们看起来很酷,但是3d形状可以扭曲感知,因此扭曲数据。坚持2 次元,确保数据准确。
/ [" H _8 J u% {2 J+ p( t ' F' a! O! ^5 Z p9 h' `& f
使用表格数字字体
) f. m7 r- Q1 @' `
表格间距赋予所有的数字相同的宽度,使它们排列时能彼此对齐,使比较更容易。大多数流行字体都内置了表格。不确定字体是否正确?就看小数点(或任何数字)是否对齐就行。
6 r0 \" s. f1 Z8 l9 Z9 Y
7 E$ x% h2 B# r0 }4 Z. W
统一感
. n7 o/ A2 z) h; E+ e 统一感使我们更容易接收信息:颜色,图像,风格,来源……
9 G: J) {" L( U 连贯的设计将有效融入背景,使用户能够轻松处理信息。最佳可视化帮助观众快速得出数据所呈现的结论
4 C! \8 \0 m5 Q3 j, c* \. F7 w! }
8 L" o2 C+ ]( b/ y1 d: J 不要过分热衷于饼图
2 \) t/ \) Z. H6 ]2 F' P; o: I
展示多个区块比例大小,所有区块(圆弧)的加和等于 100%。但最好避免使用这个图表,因为肉眼对面积大小不敏感。
& a+ ~- S) O8 X
: ` f/ j& x3 `, i+ ^* _ 折线图中使用连贯的线条
4 x6 I# i' L2 ^ 虚线,虚线容易分散注意力。相反,使用实线和颜色,反而容易区分彼此的区别。
+ {9 k7 ? v5 i+ q
+ z% F/ u5 M3 b3 f) K6 x
尊重部分所占整体的比例
* o! i9 d' Z2 [" i$ m% N
在人们多选的问题上就会出现比例的重叠,不同选项的百分比之和大于一。为了避免这种情况,不能直接把比例做成统计图。相较于呈现数值,有些图更着重于表现部分与整体的关系。
?* V# {8 f: l) d7 t! d ' {4 u) K3 k9 A& z, g. g7 L
面积、尺寸可视化
& [/ D6 K I+ W8 w; q* Q |+ X 对同一类图形(例如柱状、圆环和蜘蛛图等)的长度、高度或面积加以区别,来清晰的表达不同指标对应的指标值之间的对比。制作这类数据可视化图形时,要用数学公式计算,来表达准确的尺度和比例。
; z/ k1 S U) I$ S* u; e: ^$ J
+ `# Q) |0 y1 o 使用大小来可视化值
$ \0 d' Y9 X; O+ L8 \* u3 I/ {' ?+ R
大小可以帮助强调重要信息并添加上下文提示,使用大小来表示值配合地图使用的效果也非常好。如果您的可视化中有多个大小相同的数据点,它们会混在一起,很难区分值。
! C4 F, V% a. @7 \( D: q7 z$ ?
# G1 W# ~: C7 S# l6 j# a+ N& p 使用相同细节
. t& f r& H0 r9 p) n 添加的细节(和数字)越多,大脑处理的时间就越长。想想你想要用你的数据传达什么,以及最有效的方式是什么。
8 T$ g5 w" l6 ~9 {( L
使用基础图形
8 m! e& r- f- M3 j
一个很好的经验法则是,如果你不能高效理解,你的读者或听众可能也难理解。因此,坚持使用基础图形:直方图、条形图、维恩图、散点图和线形图。
+ t9 h5 V1 a# e/ |7 D; V2 _( N2 c
9 m, j' N7 _3 i$ Q; Y1 }/ t; P' V 视图数量
' y; w% J& i( t0 ` 将您的可视化中的视图数量限制为三到四个。如果您添加太多视图,大局会被详细信息所淹没。
) _4 N5 Z, o( `0 \, T+ @9 T
关于图表配色,你可以参考的5条准则
' G( r4 O9 R1 C. V4 j0 ?( z @5 V 颜色深浅
m; |1 A& }+ G& D6 T& t& q$ L
通过颜色的深浅来表达指标值的强弱和大小,是数据可视化设计的常用方法,用户一眼看上去便可整体的看出哪一部分指标的数据值更突出。
( P8 f& S! ?, I6 q; P% o j1 ^0 O) ^$ w! ?' @& n4 Z
使用同一色系
4 m( _+ o& m/ g1 h V! _# h k: m 颜色用得太花,会给数据增加不可承受之重,相反,设计师应该采用同一色系,或者类比色。
5 {/ k- @* P1 H/ A$ r: @5 m4 e
' \& s" ~2 j% m1 G/ k
避免使用鲜艳的颜色
% ]. r& k6 V9 ]* y0 j/ I7 ]. u" V) l
明亮鲜艳的颜色就像是把所有的字母都大写想要强调一样,你的听众感觉你在对他们大声推销。单调的颜色,反而能很好地用于数据可视化,因为它们可以让你的读者理解你的数据,而不至于被数据淹没。
2 a Q7 B/ C) ~2 B; ~& A; T
2 ~- o& Q/ G! V8 G3 D& J 标签使用不同颜色区分
S) |% B+ M8 O, F8 q
在某些情况下,在一段时间或一系列的值中,我们可能测量了不同种类的物体。例如,假设我们测量 6 个月以来狗和猫的体重。在实验结束时,我们想画出每只动物的体重,分别用蓝色和红色区分猫和狗。
( T8 f1 X. R' ]+ w; j \. q) Y8 | # k9 J2 [4 i6 f
颜色数量
8 n$ z' x: a4 n1 V g
不要在一张图上使用6种以上的颜色。
$ L5 O2 b, \( ]# i
1 |) ]; w8 W! X1 ^" V0 N9 r7 K 建议:
2 X1 s& A" ] x) o4 l$ G3 `2 S* M' M 使用具有高对比度的颜色
& N* a! L0 j- E! W: J( f+ J 使用带有图案或纹理的颜色来传达不同类型的信息
2 T3 K6 ^9 A" f V- m9 r6 T
使用文本或图标标记元素
& _* k. d* `6 M$ I- Y 标准的可视化图表一定有注释
! ]' X1 P/ W; U$ | O
解释编码
) \$ R- o& M7 }- j) \; V8 U
通过一定的形状、颜色和几何图形的结合,将数据呈现出来。为了让读者能读清楚,图表设计者就要把这些图形解码回数据值。
. m% ?; { f& x2 `3 Q$ ? 轴标签
9 @" e5 o d6 S/ v3 l7 C
这可能看起来没有必要,或者不是很有帮助,但是你无法想象,如果你的图表有点混乱,或者看到数据的人对此不是很熟悉,你会被问多少次 x/y 轴代表的是什么。按照前面的两个绘图示例,如果要为轴设置特定名称。
5 q& Y' ?; O6 t3 C$ W
标题
: W4 |) ~- h3 {6 U7 X& y
如果我们要将数据呈现给第三方,另一个基本但关键的要点是使用标题,它和之前的轴标记非常相似。
( ~# t* i7 K' x* O
0 [$ _0 T; i( [9 e* h( |9 ~ 重点元素做注释
5 x- @& F0 T8 X( `7 s7 J
通常情况下,仅仅在图表的左右两侧使用刻度本身并不是很清楚。在图上标注值对于解释图表非常有用。
( o1 C6 A! c0 g* v) c& A; W) w
Y H" K* a: t7 ~( I 重要视图位置
$ w( ?5 {4 C- n+ E7 h4 i' ]% t6 ? 将最重要的视图放置在顶部或左上角。眼睛通常会首先注意到该区域。
' i5 q* O! @" ~$ J" i) z) e
$ E/ `. |# d* Q0 f- H3 \ 优秀的可视化图表,遵守的6条原则
3 D8 J; F0 x; l! T
数据排序有序
' v5 I5 i/ j) U3 |- t" | 数据类别按字母顺序,大小顺序,或价值进行排序,以一种合乎逻辑的和直观的方式来引导读者了解数据。
0 K& b, N1 l- G& q
n# _) a" R( d! Q& f
比较数据
$ f+ W. @! D# }+ V: E! Z& {0 C 比较是展示数据差异的好法子,但是如果你的读者不容易看出差别的话,那么你的比较就毫无意义。确保所有的数据都是呈现在读者面前,选择最合适的比较方法。
: z4 u- Y# S& ]" p+ i. b F0 N- a
5 k0 G) b3 G/ s; h. u' |. E2 k' ]0 e 不可扭曲数据
2 {% n5 a M& O/ x0 `
确保所有可视化方式是准确的。例如,气泡图大小应该根据区域扩展,而不是直径。
8 h9 l) i* w* E& y2 ~# j2 h2 N0 c+ h r4 L. q7 {
展示数据
1 ^1 v7 V6 {8 `7 F- G 让读者看到数据,这是可视化的重点。确保没有数据丢失或被设计。例如,使用标准的面积图时,可以添加透明度,确保读者可以看到所有数据。
) C$ u# [( Y2 k5 `. N4 u* M 删除变量
. b- v7 J$ b2 B4 Z, [ 很多时候,太多的信息会影响读者的注意,从可视化中删除隐含信息是一个好主意,在这种情况下,我认为我们不需要在轴中包含变量的名称。
. j5 Q5 ^" d4 F6 J) l3 B5 U 避免数据噪音
: q' O+ G* [9 J! W0 ?, O 把不重要的东西减到最少或者去掉。这包括减弱或移除图形线,改变轴线、图形线的颜色,以及用浅灰色描绘电子表格行。使得“数据比率”可以达到一个很高的水平,听众会更容易明白其中的数据情况。
5 j& Q; P J( i( M& e9 n! U
+ K; l& k# g- A m
良好的数据可视化应该通过使用图形,清晰有效地传达数据信息。最佳可视化使您可以轻松地一目了然地理解数据。他们将复杂的信息以一种简单的方式分解,使目标受众能够理解并以此为基础做出决策。
/ ^8 G& y& v+ Y; T 正如Edward R. Tufte指出的那样,“设计的基本考验是它有助于理解内容,而不是它的时尚性。”数据可视化尤其应该坚持这一理念。目标是通过设计增强数据,而不是引起对设计本身的关注。
0 ^0 B4 C) z' R
各平台同名“职坐标在线”
) Q+ ~# y* t# g+ L; m