" [- W& ]- E% o 如果大家对豌豆BI的数据预处理有一定了解的话,就知道数据预处理的简单易用性,可以在数据分析之前,处理数据不完整,重复,异常值等问题,通过简单的界面操作即可完成。通过对用户需求的分析,数据预处理增加了其他更好用的功能,本文将介绍这些简单易操作的功能。
. m& F4 X' U1 g7 N' b
1. 字段信息统计
M' X( Z0 A3 i" l 在查看主题表数据,或进行数据预处理时,可以查到表中所有字段的各种统计信息,如最大值、最小值、唯一值,缺失值个数,合计值,均值,方差值大小,及数据分布情况。
5 X" e- O- Z' a, q* _4 X
+ `" s4 F5 S( {$ ~: _ 2 ?. ]+ k+ \5 G: n" q& x$ r# ]* ~
打开凤凰新闻,查看更多高清图片
; f& U3 V( w- _/ Q. g2 G" X
+ w5 K/ {$ p* I% f1 F6 d
% G: ~: V# T3 H/ ^. f- q 2. 筛选生成新表
6 y @& i% [4 l) `
对某列数据进行筛选后,工具栏上出现“筛选结果另存为Sheet”按钮,点击后即可将筛选数据存成一张新的表进行处理
1 P. Z# y3 B- h" I% L& M/ I% F

) X: X C) N- S: c
同时,可以框选界面中的任意部分数据,右键,点击“框选另存为Sheet”,将框选部分存为一张新表处理
! L, V+ |$ H# o% A( C+ w8 r, X! ^

, m7 Q1 ?# f% p; i1 e 3. 生成关联数据
# z4 ~) W; k/ u8 @* x 选择任意多张表进行关联,表之间可以进行关联后,选择表的字段生成一张新的表,新的表数据是根据设置的关联关系生成。
& E- o2 `: H0 ^) Z( H/ {
1. 选择表做关联关系
4 y2 s* v* u: L$ E( G8 k

1 K; b9 u7 I; l! [ 2. 设置关联关系类型及关联字段
O3 b* @ n: B e6 @7 m* W 
: k! [% G/ S( j7 E- x! z- j7 G
3. 选择最终生成关联新表数据需要的字段
5 e0 l2 Y! \+ i ]; W" X 
: \& ?5 k! Y% B4 q" ]$ L* P' G8 V8 U
4. 主题表数据追加覆盖
) N: Z+ p9 J, V# s, c 可以对主题表的数据进行追加或覆盖操作,此处是选择文件数据源中的文件数据,解析文件,通过设置字段对应关系,将文件中的数据追加或覆盖到主题表中。
$ I$ d2 _8 ]* `- I! F 1.操作入口,主题表列表中,主题表后面更多操作中的“追加覆盖数据”按钮:
' Y* O \3 v' j

! b, }# ^: s$ |1 f: ? 2. 选择文件数据源中的文件,点击追加或覆盖
$ W- v; q+ y8 I4 H. A 
5 T, j7 A4 @( v N [4 Y
3. 当选择的文件是EXCEL时,可以选择EXCEL文件中用户需要的工作簿,以及设置工作簿数据中的字段起始行及数据起始行
1 _$ g. H0 S5 y& E6 m3 R8 z2 f/ Z2 [3 M 
" e) y# j! d+ g$ k0 p
4. 进入数据预处理,可进行数据简单的处理后再将数据追加或覆盖到主题表中
R1 k" K" G- m/ ]: n9 W. W$ P 
) x9 X1 i+ r/ }
5. 点击追加或覆盖,设置字段对应关系,可点击按位置匹配或按名称匹配
% ]: o: `; ^8 k2 j# f

3 O0 \% t' ~2 V 也可针对某一个字段自行选择设置字段对应关系
4 ^2 u* |1 _8 j6 P/ l 
7 {8 M( R* {! D
设置完字段对应关系后,点击确定,即可将进行预处理的文件数据追加或覆盖到主题表中
( o- w2 P0 @' Z1 c5 m