& F% p3 N6 }9 ^ 如果大家对豌豆BI的数据预处理有一定了解的话,就知道数据预处理的简单易用性,可以在数据分析之前,处理数据不完整,重复,异常值等问题,通过简单的界面操作即可完成。通过对用户需求的分析,数据预处理增加了其他更好用的功能,本文将介绍这些简单易操作的功能。
) q$ A9 E" W# H* C
1. 字段信息统计
' d) M" K, }5 v; k+ K
在查看主题表数据,或进行数据预处理时,可以查到表中所有字段的各种统计信息,如最大值、最小值、唯一值,缺失值个数,合计值,均值,方差值大小,及数据分布情况。
2 G9 b' h5 M8 q ]/ _* Q& ~ 0 R, S/ {# Z# g1 ~
1 h/ H! s, n2 }- G6 y; V% M/ W
打开凤凰新闻,查看更多高清图片
7 Z( l3 A5 G9 I5 b0 E: ~% | 5 D* m& d9 Q& m* V3 `
$ [# I8 p& s% Y, Z# z U2 Y$ ]
2. 筛选生成新表
4 [8 V: s! T7 ]+ P0 o* O 对某列数据进行筛选后,工具栏上出现“筛选结果另存为Sheet”按钮,点击后即可将筛选数据存成一张新的表进行处理
. F0 ]- Z3 M* K( v# c" f2 c: X
- c0 o+ O7 i& K6 C& N 同时,可以框选界面中的任意部分数据,右键,点击“框选另存为Sheet”,将框选部分存为一张新表处理
* N" p. m: z% f3 O9 I+ |# g ]7 W, y1 m# [" k7 h' K
3. 生成关联数据
, K. d1 e" X: b0 ^: v. Q 选择任意多张表进行关联,表之间可以进行关联后,选择表的字段生成一张新的表,新的表数据是根据设置的关联关系生成。
5 v# H9 v: m+ \! J/ w. @ P
1. 选择表做关联关系
3 N/ ~0 B% Q' ^7 j' C" `
( c& }/ j; o) J: M0 ^* S" N 2. 设置关联关系类型及关联字段
; ~' n" D& p. l9 X; F7 v ' ~7 r+ c' h; f6 x. {( p9 P$ L/ ]" l
3. 选择最终生成关联新表数据需要的字段
3 k/ w$ E" q4 a4 E8 m
, T- o8 z0 V( m3 \
4. 主题表数据追加覆盖
8 m9 C' K3 P1 C* W5 M! `
可以对主题表的数据进行追加或覆盖操作,此处是选择文件数据源中的文件数据,解析文件,通过设置字段对应关系,将文件中的数据追加或覆盖到主题表中。
" w+ R) @9 z+ f% Y/ j4 k: L+ \$ R
1.操作入口,主题表列表中,主题表后面更多操作中的“追加覆盖数据”按钮:
2 E! i' V& m8 x0 E
9 s1 |. ~0 A) E$ S$ K) v) |0 j( D2 v 2. 选择文件数据源中的文件,点击追加或覆盖
6 ^- k9 S9 r( k' M2 k
# e9 @3 e" N+ H; g$ d- @9 k 3. 当选择的文件是EXCEL时,可以选择EXCEL文件中用户需要的工作簿,以及设置工作簿数据中的字段起始行及数据起始行
, t$ L6 i8 J2 C/ O, ?3 a
! _4 f' F: G0 J* C7 d6 v
4. 进入数据预处理,可进行数据简单的处理后再将数据追加或覆盖到主题表中
& Q5 t& @" k' u! f - X- [* r# L8 Y C' Z
5. 点击追加或覆盖,设置字段对应关系,可点击按位置匹配或按名称匹配
& Q8 C% E b1 B7 C
7 ~% S9 }: `$ N; e r( Q4 R
也可针对某一个字段自行选择设置字段对应关系
9 S$ R, l4 L/ L7 ^1 Y$ [7 W
3 k- C1 [) y1 O: a) W7 g 设置完字段对应关系后,点击确定,即可将进行预处理的文件数据追加或覆盖到主题表中
- f c: t8 F, I! p/ z