) n: n5 A" O5 e {5 O# C# z
常用的数据可视化方法有哪些?数据可视化可以通过视觉形式来呈现抽象的数据信息,有利于对数据进行更深入的观察和分析,想了解如何用编程定制属于自己的数据可视化?可以往下看看。
& B9 l0 c8 t/ y' S$ \* S+ ] e9 U* F
' w# Z) n6 v$ i" t' ~+ x
5 h1 G4 R, G+ m, i- o4 X" v% b6 a* } 打开凤凰新闻,查看更多高清图片
# h* V" s0 @9 \5 f7 }$ F0 H3 z
" I: n/ x' U# r! ?( l1 f" k ~ * R: n' K2 ~: T8 \! A3 S/ A
第一步:处理和格式化数据
; B0 B& ]/ ^5 U* `" c2 g' j6 w
Python:当我有一个非矩形分隔的文件 ,或数据比较凌乱时,我会写一些特别的Python脚本。幸运的话,我会找到并重新利用过去已有的脚本。有时会用Beautiful Soup来修饰,有时会用csvkit 。
7 r4 C. a+ } w# b" y6 {
R:我只有在需要加载csv格式表格时才会用到R,通常只是做数据聚合,合并,或处理从原来的数据中派生的部分。
0 J8 s) k" p7 v9 ~3 `% V Tabula:多用于公开的政府数据,包括在 PDF文件中涉及的数据。没有 Tabula的话这个过程将非常痛苦。
: G# `4 {7 Q5 M5 E' ~1 B' T
Microsoft Excel:只有在有需求的时候才会用到它。数据读入Excel中,然后再导入像Numbers或是OpenOffice这样的工具中。
# w% b3 |5 z2 h) T
Google Sheets:有时使用电子表格比写脚本更快,我很喜欢这样简洁的过程。
$ |( E+ y/ g' B+ a% u' } T0 g* G 第二步:分析数据
9 E7 i6 L* F4 n& } 在你去做最后的图形之前,你需要先了解这个数据集。
- f$ ?- `, p1 E; B3 }; Q7 t; q 这里我想到的是R。因为R作为一个开源的统计计算语言,它有一个很丰富的社区,数不尽的扩展包,以及在Stack Overflow上大量的已解答的问题。
5 s4 h3 N/ _8 j# Q* y9 g8 k
第三步:制作静态图形
/ |+ n: P6 d: O% c, o z# b1 f" m 这对我来说通常包含两个阶段:(i)在R中进行可视化; (ii)在Illustrator中润色。
4 U( i" {. {/ n. c! y! Y' b R:在R中有可视化工具包,如ggplot2,但我几乎全部使用R自带的那些功能,即base R。
2 G% ]9 S5 j: H( E+ f Adobe Illustrator:如果图形要发布给别人看,我会以PDF格式保存R生成的图形,并在Illustrator中编辑。虽然有些矫枉过正,但效果还不错。我也在考虑试着用Sketch。
) G1 N8 A/ B$ U: g2 Y
第四步:制作交互式图形
; F# p/ M3 v9 c$ J6 w Flash已经过时了,而Java是新的宠儿。R在这里应用不广。
7 z' Y7 l, i8 I1 ]* d+ o/ R l' I) B
d3.js:我用数据驱动的文档来做交互式的数据可视化(我还在学习中)。有许多例子可以用来试手。但如果我想快速完成一个图表,我有时也会尝试用 Vega-Lite 。
+ c: Z) h- Y% Q, R1 E0 g 但其实,我并不推荐大家用编程做数据可视化,除非是技术大佬想专研一些特别厉害的可视化。普通的使用建议大家可以使用零编程的可视化工具。
5 t9 ], v, ~, n7 [) g* H$ V7 p6 Q
常用的数据可视化方法有哪些?常用的可视化工具:
& P, o' M. Y' I- T0 e/ ^# O 1、Microsoft Excel
9 B. W _- |* ~' R7 B1 x" W
对于这个软件大家应该并不陌生,对于一般的可视化这个软件完全足矣,但是对于一些数据量较大的数据则不太适合。
% g' N) c" ~: _/ o
2、Smartbi
( a p- C$ o1 Y- {1 ~% T" [9 K Smartbi现在比较受大家的欢迎,既可以超越Excel做一些稍微复杂的数据分析,又不用像R、Python那种编程语言进行可视化那么复杂。比较适合业务人员使用,简单拖拽就能生成自己想要的图表。支持业务主题和自助数据集,双布局设计,跨屏发布到APP,支持流式布局,功能还是很实用的。
* J- S( T8 L( W* M" c/ O9 I