* V' b8 K: }: f! X
大数据时代,数据驱动决策。处理不好庞大、复杂的数据,其价值将大打折扣。
. z% z% G3 v$ t' C* o4 V5 v" J 可以想象一本没有图片的教科书。没有图表、图形或是带有箭头和标签的插图或流程图,那么这门学科将变得更加难以理解。人类天生就是视觉动物,而视觉效果对于分析数据、传达实验结果甚至做出惊人的发现至关重要。
# A( {& a6 d, E* \1 L
工作中我们可能会接触到很多业务数据,需要在总结汇报中展示呈现,俗话说“字不如表,表不如图”,那么如何缩短数据与用户的距离?让用户一眼Get到重点?让老板赞同你的汇报方案呢?
" Q9 Y* s% Q) ^1 m8 o3 r 『《大西洋古抄本》是达芬奇的手稿集册中最大的一部,共 12 卷,1119 张,年代分布为 1478 年到 1519 年。每个方块代表一页手稿,上面的颜色代表涉及的主题,包括几何与代数、物理学与自然科学、工具和机器、建筑与应用艺术和人文科学。点开每一个小方块还可以看到每一页上面达芬奇写了什么,涉及了 36 个小话题,包括了马、食谱、绘画、灵魂、童话故事、笑话等很多有意思的小话题。』
! P% d1 @' K$ V* R9 [ 
; D8 c4 K- `. e8 i6 \# }
是这样的么?
" c& g8 e2 X1 o9 ]9 K+ K
这样炫酷的数据可视化,小编真的不会。开个玩笑,其实工作中我们并不需要作出很炫酷的视觉呈现,数据可视化主要旨在借助于图形化手段,清晰有效地传达与沟通信息,有效地传达思想概念,美学形式与功能需要齐头并进,通过直观地传达关键的方面与特征,从而实现对于相当稀疏而又复杂的数据集的深入洞察。因此在设计过程中,每一个选择,最终都应落脚于读者的体验,而非图表制作者个人。
3 e7 y+ C1 D7 h f
你不得不注意的图表制作小技巧
; D/ V) G4 P- S' p
条形图的基线必须从零开始
; O: Q1 I0 i2 t. m* Z+ e
Y轴不从零开始,可以使数据看起来具有比实际存在的更大的差距。这使得可视化会误导传输信息。条形图的原理就是通过比较条块的长度来比较值的大小。当基线被改变了,视觉效果也就扭曲了。
- M' X# i$ a0 b$ u1 ~ 
3 p$ T: ` m {9 g) P ^) V% f
使用简单易读的字体
) Y* O; {+ o# |3 P2 w( _& f' [
有些时候,排版可以提升视觉效果,增加额外的情感和洞察力。但数据可视化不包括在内。坚持使用简单的无衬线字体(通常是Excel等程序中的默认字体)。无衬线字体即是那些文字边缘没有小脚的字体。字体选择可以影响文本的易读性,增强或减损预期的含义。因此,最好避免艺术字体并坚持使用更基本的常用字体。
y6 ~& ~* E2 p& ^2 @
& q, Y( t9 K, d4 w+ S
5 S1 [# J. T% d: { h 打开凤凰新闻,查看更多高清图片
. g4 _5 q+ e2 h, w+ N* f
6 r' d: V2 K0 P; U
" ]% Y# @* J( P" C: Z( q+ l
条状图宽度适度
4 M$ ^/ q+ |& x9 A; D# o 条形图之间的间隔应该是1/2栏宽度。
O) _. I8 r1 N- Z0 } 
* x* X8 s& f( `$ O1 H+ W 使用2D图形
4 G g J) K: s1 l9 C( C. h) g
虽然他们看起来很酷,但是3d形状可以扭曲感知,因此扭曲数据。坚持2 次元,确保数据准确。
; k8 r0 b# v/ |5 b4 O7 B 
! F$ w) ~7 _, V+ b* ~, c 使用表格数字字体
# t7 h; d* w* S, W
表格间距赋予所有的数字相同的宽度,使它们排列时能彼此对齐,使比较更容易。大多数流行字体都内置了表格。不确定字体是否正确?就看小数点(或任何数字)是否对齐就行。
% j/ b9 W& g. M/ ^# [& i% ]* Q! u. ^8 Q& h

1 L8 H, y/ {' [* r$ n4 l" l 统一感
% i8 O5 L) Z; v8 ^; |
统一感使我们更容易接收信息:颜色,图像,风格,来源……
, b, r F$ ?6 Q1 W) A5 D- o
连贯的设计将有效融入背景,使用户能够轻松处理信息。最佳可视化帮助观众快速得出数据所呈现的结论
) @' K; B, \9 v6 e* c 
% T5 w/ S/ D& ^( l9 v. h
不要过分热衷于饼图
R1 g; t) P) d5 O& o: r( x# p
展示多个区块比例大小,所有区块(圆弧)的加和等于 100%。但最好避免使用这个图表,因为肉眼对面积大小不敏感。
& y2 U+ W/ [- ^

' s0 q; S/ ]1 M) k* c 折线图中使用连贯的线条
. D- Y1 a# t8 J: f9 \/ g, }- L9 d' y
虚线,虚线容易分散注意力。相反,使用实线和颜色,反而容易区分彼此的区别。
1 [7 v; Q* z$ O- ]( C1 z5 b

" m+ z/ ?/ W/ [1 _; b/ p( \6 Q
尊重部分所占整体的比例
9 [) H# h" c) O6 g# x" ]' P 在人们多选的问题上就会出现比例的重叠,不同选项的百分比之和大于一。为了避免这种情况,不能直接把比例做成统计图。相较于呈现数值,有些图更着重于表现部分与整体的关系。
H3 U: Q/ T, \6 [1 x

. S' o1 x& E2 g( _" } 面积、尺寸可视化
8 e2 `; e; l+ \ R- O3 W: i 对同一类图形(例如柱状、圆环和蜘蛛图等)的长度、高度或面积加以区别,来清晰的表达不同指标对应的指标值之间的对比。制作这类数据可视化图形时,要用数学公式计算,来表达准确的尺度和比例。
; K. q2 d5 b* Q4 `: P7 i1 ^* p3 d 
2 }% } @1 q9 [+ `- \, n
使用大小来可视化值
* \% V B7 W4 L4 f2 v) s
大小可以帮助强调重要信息并添加上下文提示,使用大小来表示值配合地图使用的效果也非常好。如果您的可视化中有多个大小相同的数据点,它们会混在一起,很难区分值。
& R+ g2 c/ o* C 
3 \: X, A; C* j
使用相同细节
- F" u/ Y B- g) b
添加的细节(和数字)越多,大脑处理的时间就越长。想想你想要用你的数据传达什么,以及最有效的方式是什么。
6 C% `3 D+ I1 h. N9 e! C 使用基础图形
# n" j7 ], ~& w8 u+ O0 C% I( G
一个很好的经验法则是,如果你不能高效理解,你的读者或听众可能也难理解。因此,坚持使用基础图形:直方图、条形图、维恩图、散点图和线形图。
' y- R, B9 ?/ O8 ^ 
1 Q) K V0 q, _; x3 Z3 |: o9 V# F7 h
视图数量
3 f1 ~# h6 X! N% K3 D* w8 W' D 将您的可视化中的视图数量限制为三到四个。如果您添加太多视图,大局会被详细信息所淹没。
$ ?5 O( j2 W0 ]% [8 U! C( ^
关于图表配色,你可以参考的5条准则
/ e; {5 h, a% x6 v 颜色深浅
) l; Z: q5 c/ j. l) a- {# j 通过颜色的深浅来表达指标值的强弱和大小,是数据可视化设计的常用方法,用户一眼看上去便可整体的看出哪一部分指标的数据值更突出。
6 U9 U1 ?+ x0 U; M7 b3 K 
3 c4 j( I5 v/ c2 v 使用同一色系
" Q. T6 l: t2 \4 v; z- T, P 颜色用得太花,会给数据增加不可承受之重,相反,设计师应该采用同一色系,或者类比色。
' W+ \( }, G: X( q, E& m% p 
3 v' u& L% b2 m7 x5 w 避免使用鲜艳的颜色
) _' N) ~( n3 E0 }: I 明亮鲜艳的颜色就像是把所有的字母都大写想要强调一样,你的听众感觉你在对他们大声推销。单调的颜色,反而能很好地用于数据可视化,因为它们可以让你的读者理解你的数据,而不至于被数据淹没。
1 m8 J% l4 o. i" T 4 O' V( o1 ~# i+ \7 T7 Y
标签使用不同颜色区分
1 ^5 l D* A# t) Y5 X3 W8 v
在某些情况下,在一段时间或一系列的值中,我们可能测量了不同种类的物体。例如,假设我们测量 6 个月以来狗和猫的体重。在实验结束时,我们想画出每只动物的体重,分别用蓝色和红色区分猫和狗。
9 X* ]( B4 K, M% B& C& l) O
* l- `9 m" O5 @# R' }0 n 颜色数量
9 F, Z; `" M3 T& b) p' i. I
不要在一张图上使用6种以上的颜色。
3 S8 w- U/ y, X9 v
9 [5 E# m$ ~. `) u5 |, ^. j
建议:
0 s+ z% ]- d3 g8 @
使用具有高对比度的颜色
- ?9 t# l t0 c
使用带有图案或纹理的颜色来传达不同类型的信息
- S4 W' |, |9 a# [ T
使用文本或图标标记元素
2 J ?; O! J# \# F4 G
标准的可视化图表一定有注释
5 y# b" b8 m, m# A s' b* z
解释编码
4 p5 V3 {0 ]3 o" k+ Z4 ^5 P- t
通过一定的形状、颜色和几何图形的结合,将数据呈现出来。为了让读者能读清楚,图表设计者就要把这些图形解码回数据值。
$ m( Y9 J3 h( Y' \ 轴标签
- c4 k# ^1 U/ m1 o% m
这可能看起来没有必要,或者不是很有帮助,但是你无法想象,如果你的图表有点混乱,或者看到数据的人对此不是很熟悉,你会被问多少次 x/y 轴代表的是什么。按照前面的两个绘图示例,如果要为轴设置特定名称。
I: Y/ t8 H* a7 _$ j* Z. J4 Q 标题
0 \. r* m, J' `, l+ k
如果我们要将数据呈现给第三方,另一个基本但关键的要点是使用标题,它和之前的轴标记非常相似。
/ y5 | {) D# Q& l# f
4 |6 g T; D* {( V& F" w
重点元素做注释
2 ~% t s, M8 X7 z
通常情况下,仅仅在图表的左右两侧使用刻度本身并不是很清楚。在图上标注值对于解释图表非常有用。
( ]" i6 c7 w. N/ I1 I" k
2 ^$ d7 J$ _) q8 f% {3 N! V% G
重要视图位置
& i+ x) A( k" ]2 }2 O 将最重要的视图放置在顶部或左上角。眼睛通常会首先注意到该区域。
. P! t6 ~7 F/ s
4 A7 H2 L+ Y- P7 Z7 n$ | 优秀的可视化图表,遵守的6条原则
( U F" `2 @+ F" Z3 g
数据排序有序
- y0 q7 W# D( U1 o l 数据类别按字母顺序,大小顺序,或价值进行排序,以一种合乎逻辑的和直观的方式来引导读者了解数据。
' U$ H; L0 j! y+ _1 x {* Q; v- p2 Q; z' M0 `4 {# o5 Y) T
比较数据
3 e. _8 C- z/ [# U* i1 B. n3 ~2 Y 比较是展示数据差异的好法子,但是如果你的读者不容易看出差别的话,那么你的比较就毫无意义。确保所有的数据都是呈现在读者面前,选择最合适的比较方法。
3 w+ E3 w; l( f0 p1 Q! \
H: `6 d6 C1 H& k# J 不可扭曲数据
: d4 Y1 v/ N# B [
确保所有可视化方式是准确的。例如,气泡图大小应该根据区域扩展,而不是直径。
5 O% w8 s) A$ @7 W* Z2 Y! ~, x: W4 s0 j) x% J1 w; b
展示数据
# b5 n6 ]: E8 @8 W2 f
让读者看到数据,这是可视化的重点。确保没有数据丢失或被设计。例如,使用标准的面积图时,可以添加透明度,确保读者可以看到所有数据。
' ` U/ E1 o4 h: ]1 S6 V 删除变量
+ G: a$ f8 J3 {, r$ x3 G 很多时候,太多的信息会影响读者的注意,从可视化中删除隐含信息是一个好主意,在这种情况下,我认为我们不需要在轴中包含变量的名称。
1 |$ q9 }' b, Y2 u1 {
避免数据噪音
q/ C$ J! `( a, N/ B4 K) |
把不重要的东西减到最少或者去掉。这包括减弱或移除图形线,改变轴线、图形线的颜色,以及用浅灰色描绘电子表格行。使得“数据比率”可以达到一个很高的水平,听众会更容易明白其中的数据情况。
* L. C4 b0 H7 p: ^ s! x
- L/ v1 M5 [$ A1 S 良好的数据可视化应该通过使用图形,清晰有效地传达数据信息。最佳可视化使您可以轻松地一目了然地理解数据。他们将复杂的信息以一种简单的方式分解,使目标受众能够理解并以此为基础做出决策。
! _, f: I* o: a/ w4 x% f 正如Edward R. Tufte指出的那样,“设计的基本考验是它有助于理解内容,而不是它的时尚性。”数据可视化尤其应该坚持这一理念。目标是通过设计增强数据,而不是引起对设计本身的关注。
! ]- Y2 o& L H# M, O$ }9 _ 各平台同名“职坐标在线”
0 B6 M, y4 r2 e* V* g