% ]+ o. M/ G! F* ~& x 如果大家对豌豆BI的数据预处理有一定了解的话,就知道数据预处理的简单易用性,可以在数据分析之前,处理数据不完整,重复,异常值等问题,通过简单的界面操作即可完成。通过对用户需求的分析,数据预处理增加了其他更好用的功能,本文将介绍这些简单易操作的功能。
% ]6 h/ M- l5 m$ [5 h: C p 1. 字段信息统计
( c b/ L) ^0 w) @% o D+ D
在查看主题表数据,或进行数据预处理时,可以查到表中所有字段的各种统计信息,如最大值、最小值、唯一值,缺失值个数,合计值,均值,方差值大小,及数据分布情况。
/ p% g7 g1 V) J- V7 f8 z6 D: t
' M* ?1 `. `2 ?4 u$ B: k
" z+ B) N+ V& J! X. S8 c1 i- m, i 打开凤凰新闻,查看更多高清图片
7 b: c" t- b: j8 {
5 P/ U j1 K# m. g
; n6 K* A" f' v3 U 2. 筛选生成新表
5 z4 q$ |' h& _6 z4 R3 g* Z 对某列数据进行筛选后,工具栏上出现“筛选结果另存为Sheet”按钮,点击后即可将筛选数据存成一张新的表进行处理
2 V# I7 D1 F; r( ?) U

- i- ~4 F9 j3 u: j( o
同时,可以框选界面中的任意部分数据,右键,点击“框选另存为Sheet”,将框选部分存为一张新表处理
: p4 ~3 A& ]0 H: f8 r

& p7 Z9 r5 d" H 3. 生成关联数据
8 a( m, \3 Y) {$ ]2 x
选择任意多张表进行关联,表之间可以进行关联后,选择表的字段生成一张新的表,新的表数据是根据设置的关联关系生成。
( Z; I+ y/ Y( s7 c9 R
1. 选择表做关联关系
% g8 X* C" D6 k) c( t

6 d1 m0 t: h! q' `1 `- [4 A. _ 2. 设置关联关系类型及关联字段
6 K: g9 \- \9 _4 M. S0 E4 i

- H9 Z1 Q: V0 p* ]( `! _! Z
3. 选择最终生成关联新表数据需要的字段
% W7 l5 D+ X% G' g) v6 B) c 
8 @, A5 Y- ]8 O- d7 i8 V9 L# | 4. 主题表数据追加覆盖
7 I9 v4 p2 J: k! ^4 ]9 {
可以对主题表的数据进行追加或覆盖操作,此处是选择文件数据源中的文件数据,解析文件,通过设置字段对应关系,将文件中的数据追加或覆盖到主题表中。
- g" b8 ?0 n7 v P6 ]% F$ t 1.操作入口,主题表列表中,主题表后面更多操作中的“追加覆盖数据”按钮:
T) _4 ~" r/ }3 O4 F0 L. t 
. f# {# y w* @6 Y4 |# n 2. 选择文件数据源中的文件,点击追加或覆盖
* Z0 e* I, g+ t8 R) D( | 
% Y: @4 e, x: n, ^; M 3. 当选择的文件是EXCEL时,可以选择EXCEL文件中用户需要的工作簿,以及设置工作簿数据中的字段起始行及数据起始行
; Z1 ]4 t2 N- n" q6 h2 K! j! p9 t/ f

! d- B3 B `8 q# y* ]: A% F 4. 进入数据预处理,可进行数据简单的处理后再将数据追加或覆盖到主题表中
5 _2 O& N# w% y8 F* {+ M' e' K$ D

$ ?5 X" U8 |2 }% f 5. 点击追加或覆盖,设置字段对应关系,可点击按位置匹配或按名称匹配
7 w: t1 Z; G8 S- g 
9 k4 o% ?4 v* K$ D, B( K
也可针对某一个字段自行选择设置字段对应关系
# D( J9 i+ |% |, z2 m 
0 H: k# l- H5 U5 R' w4 S* W 设置完字段对应关系后,点击确定,即可将进行预处理的文件数据追加或覆盖到主题表中
* O% e8 _) c7 O) \# k