2 B8 t" u: I- H 如果大家对豌豆BI的数据预处理有一定了解的话,就知道数据预处理的简单易用性,可以在数据分析之前,处理数据不完整,重复,异常值等问题,通过简单的界面操作即可完成。通过对用户需求的分析,数据预处理增加了其他更好用的功能,本文将介绍这些简单易操作的功能。
' e' X1 S! @& E5 Z3 ^
1. 字段信息统计
9 e! @, Y- P# Y; ?$ q" _ 在查看主题表数据,或进行数据预处理时,可以查到表中所有字段的各种统计信息,如最大值、最小值、唯一值,缺失值个数,合计值,均值,方差值大小,及数据分布情况。
# j9 }% L5 }$ S, \# @9 ?
7 V* p5 M9 }$ I5 i0 U& w
: e$ A Y+ _0 A4 c. m
打开凤凰新闻,查看更多高清图片
0 p% M1 r2 `$ O9 Z% t/ X6 x) G% \8 E
; @0 O7 a3 w& h0 A1 w* v
4 A: N% g3 w% R4 @, Y7 B 2. 筛选生成新表
4 B# q$ _3 w d1 ^! x: J
对某列数据进行筛选后,工具栏上出现“筛选结果另存为Sheet”按钮,点击后即可将筛选数据存成一张新的表进行处理
6 X2 f( \ a4 h8 ]" k. z- u 
' y5 T6 s( K8 J0 B! C9 x 同时,可以框选界面中的任意部分数据,右键,点击“框选另存为Sheet”,将框选部分存为一张新表处理
+ _# G l2 L- s r: Q7 C( W

) s3 R5 \7 w" \4 f. m4 I+ Z7 i# y4 X$ R 3. 生成关联数据
: u- F5 o1 C) S0 n
选择任意多张表进行关联,表之间可以进行关联后,选择表的字段生成一张新的表,新的表数据是根据设置的关联关系生成。
. A' H) A2 o- A* ?
1. 选择表做关联关系
1 r0 Q0 E- L9 Z; I

5 |8 c8 g7 C$ B# P: H% c2 O% B! _
2. 设置关联关系类型及关联字段
% D2 x3 B- j7 E/ d! A 
/ f: D, @$ q' H 3. 选择最终生成关联新表数据需要的字段
5 a+ W R+ k5 _ 
2 K. G1 w: q! g: C+ j, v
4. 主题表数据追加覆盖
& W0 A% V& D9 u4 D9 [4 r, R
可以对主题表的数据进行追加或覆盖操作,此处是选择文件数据源中的文件数据,解析文件,通过设置字段对应关系,将文件中的数据追加或覆盖到主题表中。
- u3 b5 l3 |" { 1.操作入口,主题表列表中,主题表后面更多操作中的“追加覆盖数据”按钮:
7 P6 r$ w( E. E) [. ]# K 
( \) |" I& V! \4 n. w/ a! q- N# M
2. 选择文件数据源中的文件,点击追加或覆盖
) }& y; t2 B6 q5 [5 U9 D* [, j

+ k. Y; J3 K/ o S0 P% C( J( V% M2 E 3. 当选择的文件是EXCEL时,可以选择EXCEL文件中用户需要的工作簿,以及设置工作簿数据中的字段起始行及数据起始行
0 S3 |5 B* k5 C: s6 ~( p

0 h% ]% k5 M, m* g! ]' J4 b. t& i. G 4. 进入数据预处理,可进行数据简单的处理后再将数据追加或覆盖到主题表中
# C* G1 h: V) P* X2 O8 [9 H

' \$ ]6 X/ E7 _: y3 T
5. 点击追加或覆盖,设置字段对应关系,可点击按位置匹配或按名称匹配
/ O8 D# h( V2 K) s1 ?: }; J7 N$ r

5 [( L5 i$ C0 n$ Z. z& J! i; p- B 也可针对某一个字段自行选择设置字段对应关系
7 g0 x5 A9 U" r; G. u* N

L; t# m5 K) U% k' G# ~; k5 Y$ O# M 设置完字段对应关系后,点击确定,即可将进行预处理的文件数据追加或覆盖到主题表中
6 }+ {$ q& R3 j6 }' J& X) B