1 B$ s4 n+ o* f- l& j" g$ B
如果大家对豌豆BI的数据预处理有一定了解的话,就知道数据预处理的简单易用性,可以在数据分析之前,处理数据不完整,重复,异常值等问题,通过简单的界面操作即可完成。通过对用户需求的分析,数据预处理增加了其他更好用的功能,本文将介绍这些简单易操作的功能。
1 h+ g' N c. G0 S
1. 字段信息统计
2 i- }3 |. n# _ [0 n- B2 b2 q' ` 在查看主题表数据,或进行数据预处理时,可以查到表中所有字段的各种统计信息,如最大值、最小值、唯一值,缺失值个数,合计值,均值,方差值大小,及数据分布情况。
/ g! d5 \* q/ [+ ?4 R, F
' a5 M' m) c$ ~$ l5 q2 ~# Y2 ]5 o! r% Q
/ `1 U: m! F) t% [9 O' y" d 打开凤凰新闻,查看更多高清图片
+ n% @8 p3 w, A9 L' G8 E! F7 I5 J' L
' t G; C* S( @1 L& H* o1 ^% I Y& B# N# {% F9 d. V
2. 筛选生成新表
; j8 ? p+ D" }+ s9 g* |! h 对某列数据进行筛选后,工具栏上出现“筛选结果另存为Sheet”按钮,点击后即可将筛选数据存成一张新的表进行处理
* N" |: d& g4 p 
2 |2 ~; g H0 U& F1 p9 F 同时,可以框选界面中的任意部分数据,右键,点击“框选另存为Sheet”,将框选部分存为一张新表处理
- [8 C# l5 ^; f 
/ l: H9 d9 i+ O. `" K: `# m 3. 生成关联数据
( U! F; w+ J! f- z
选择任意多张表进行关联,表之间可以进行关联后,选择表的字段生成一张新的表,新的表数据是根据设置的关联关系生成。
6 ^: k- k9 Y( D) H* U
1. 选择表做关联关系
^7 Y; R: d+ T' x1 y# d

6 ^1 o7 c1 r2 U 2. 设置关联关系类型及关联字段
D# b+ U4 U* D/ O: r

, ?+ N: X, `3 r' i& X; C
3. 选择最终生成关联新表数据需要的字段
; C$ o* e+ ~" e 
5 T! `4 y8 m& d- `. X0 k
4. 主题表数据追加覆盖
$ {" F* ?$ a6 Z% j( S 可以对主题表的数据进行追加或覆盖操作,此处是选择文件数据源中的文件数据,解析文件,通过设置字段对应关系,将文件中的数据追加或覆盖到主题表中。
) q/ U3 z" d; s2 n& Y
1.操作入口,主题表列表中,主题表后面更多操作中的“追加覆盖数据”按钮:
' |9 e# n2 v* l, C; F/ C8 j4 L 
; ]8 U0 Z" P8 H* H1 ?- \
2. 选择文件数据源中的文件,点击追加或覆盖
) v! q# V4 {; g) N0 D

5 P: }% i. J" \/ @- A
3. 当选择的文件是EXCEL时,可以选择EXCEL文件中用户需要的工作簿,以及设置工作簿数据中的字段起始行及数据起始行
- L- ?. y* w1 g/ {: L* P

4 |3 t4 ]# T& I E" d 4. 进入数据预处理,可进行数据简单的处理后再将数据追加或覆盖到主题表中
* M: L3 c" {9 w! M/ J9 j) d6 }

% Q. a1 F! q+ G- Y 5. 点击追加或覆盖,设置字段对应关系,可点击按位置匹配或按名称匹配
; r% X3 }7 [, `

9 A# N1 I/ C _% g R {, X 也可针对某一个字段自行选择设置字段对应关系
/ B+ d4 ?2 H2 v4 |4 n 
! X3 r, x/ S. l4 }% a6 ]. C5 \
设置完字段对应关系后,点击确定,即可将进行预处理的文件数据追加或覆盖到主题表中
: ?& E2 C% w9 u1 _