# ~, s/ o% E X6 X! t* p
如果大家对豌豆BI的数据预处理有一定了解的话,就知道数据预处理的简单易用性,可以在数据分析之前,处理数据不完整,重复,异常值等问题,通过简单的界面操作即可完成。通过对用户需求的分析,数据预处理增加了其他更好用的功能,本文将介绍这些简单易操作的功能。
8 t0 E% T: v1 Q8 d8 C
1. 字段信息统计
9 [, U- j4 W5 g
在查看主题表数据,或进行数据预处理时,可以查到表中所有字段的各种统计信息,如最大值、最小值、唯一值,缺失值个数,合计值,均值,方差值大小,及数据分布情况。
G( n% L* R. h5 @
: m5 ~) G5 G% I) i8 t9 k - q; R0 d5 j$ K. V3 G. d, ^
打开凤凰新闻,查看更多高清图片
, y" k; R- Z7 L3 I1 N
5 u& Y/ i- `& ^0 n4 U0 e
* m' _$ H7 y2 u5 G6 z 2. 筛选生成新表
# \$ W" g+ d# b* R7 R( L$ u F 对某列数据进行筛选后,工具栏上出现“筛选结果另存为Sheet”按钮,点击后即可将筛选数据存成一张新的表进行处理
2 W5 d$ n9 e0 F* n

+ `' a0 ^- \& @4 N+ P0 \
同时,可以框选界面中的任意部分数据,右键,点击“框选另存为Sheet”,将框选部分存为一张新表处理
/ e; p1 B$ ]" s 
9 K$ g K& m/ p3 J) t- i+ ?
3. 生成关联数据
% M9 P* m7 ~, `2 {( x 选择任意多张表进行关联,表之间可以进行关联后,选择表的字段生成一张新的表,新的表数据是根据设置的关联关系生成。
+ s& p- N4 s* d; d$ g
1. 选择表做关联关系
$ h" W2 { Z$ P3 X 
3 a: {3 N# U% g& e) p# y! `. W 2. 设置关联关系类型及关联字段
2 F) {1 s; k* `# i6 {0 _+ G3 i 
( e8 ?5 l$ O D; `5 O: F5 a0 m 3. 选择最终生成关联新表数据需要的字段
4 e5 l( {+ y* F1 p 
+ I8 K* w1 ]( n/ \8 A 4. 主题表数据追加覆盖
: y9 N, C5 {( ^% T
可以对主题表的数据进行追加或覆盖操作,此处是选择文件数据源中的文件数据,解析文件,通过设置字段对应关系,将文件中的数据追加或覆盖到主题表中。
# Z! U% P+ N- Y5 Y& M 1.操作入口,主题表列表中,主题表后面更多操作中的“追加覆盖数据”按钮:
* z; ~! ]& b. J& c, ^. ]

, Q2 Z: H5 \1 R# c7 _/ \ c: Q, O9 k 2. 选择文件数据源中的文件,点击追加或覆盖
( z" X8 P* j9 O0 V4 P% j 
, [) B+ q2 }( j8 h, |
3. 当选择的文件是EXCEL时,可以选择EXCEL文件中用户需要的工作簿,以及设置工作簿数据中的字段起始行及数据起始行
' h" j; g! y. {* \4 I

( ^1 i7 y4 f# m; r6 Q0 u 4. 进入数据预处理,可进行数据简单的处理后再将数据追加或覆盖到主题表中
* k7 {# x4 S i5 I/ `1 Z* f 
$ V2 R5 _4 z2 g6 K9 q. F 5. 点击追加或覆盖,设置字段对应关系,可点击按位置匹配或按名称匹配
( V/ P( }' C/ ?3 H+ N; `% N! v

: S$ h' C- D. `7 b: c% m 也可针对某一个字段自行选择设置字段对应关系
! Q! i% b; v/ @0 r4 @( H

* ~( g/ I5 i( Y, B
设置完字段对应关系后,点击确定,即可将进行预处理的文件数据追加或覆盖到主题表中
: V% W) D- M) n6 l& |/ L6 F