) W+ H3 I, I1 l
如果大家对豌豆BI的数据预处理有一定了解的话,就知道数据预处理的简单易用性,可以在数据分析之前,处理数据不完整,重复,异常值等问题,通过简单的界面操作即可完成。通过对用户需求的分析,数据预处理增加了其他更好用的功能,本文将介绍这些简单易操作的功能。
, Y$ R" S( S& \0 }% c
1. 字段信息统计
( l8 [) _; \, }% R1 b 在查看主题表数据,或进行数据预处理时,可以查到表中所有字段的各种统计信息,如最大值、最小值、唯一值,缺失值个数,合计值,均值,方差值大小,及数据分布情况。
, B" E2 j% S: Z1 I
0 U0 o0 r7 M7 E& X: i8 y
k, f% s ^+ e6 G 打开凤凰新闻,查看更多高清图片
& k% C' p5 d1 S8 |( `
2 }8 e5 ?) s! u- T! q : b( [4 z. t' T$ d6 Q/ y
2. 筛选生成新表
: H7 B: f* K. t( B; Q 对某列数据进行筛选后,工具栏上出现“筛选结果另存为Sheet”按钮,点击后即可将筛选数据存成一张新的表进行处理
8 X, f) q V; ]& } 
2 _8 }. b) @" K1 C n+ @+ t+ f; Y9 c
同时,可以框选界面中的任意部分数据,右键,点击“框选另存为Sheet”,将框选部分存为一张新表处理
/ y/ D, W6 L* ~4 ~; c

# f5 i) Z3 w \( @2 F6 X
3. 生成关联数据
# H, w1 E, @: Y8 _) v7 f
选择任意多张表进行关联,表之间可以进行关联后,选择表的字段生成一张新的表,新的表数据是根据设置的关联关系生成。
- ^! H6 F4 K: m6 |" {7 k
1. 选择表做关联关系
% r e" ^% g! C& I+ {: a

2 k' R! ]2 J% o3 L; |/ s 2. 设置关联关系类型及关联字段
$ u( N5 H/ G$ a0 v" r' i/ E 
( c4 h3 v* C) s, I8 s# ~8 ^
3. 选择最终生成关联新表数据需要的字段
) X6 |2 `% T. I& i$ r H' L 
! v; e0 n" y( @7 W" @ 4. 主题表数据追加覆盖
8 S9 R; v3 q# @/ I& _
可以对主题表的数据进行追加或覆盖操作,此处是选择文件数据源中的文件数据,解析文件,通过设置字段对应关系,将文件中的数据追加或覆盖到主题表中。
, N2 e* N0 y! X+ r. R# [ 1.操作入口,主题表列表中,主题表后面更多操作中的“追加覆盖数据”按钮:
( H, g: `5 r) v0 s

0 e, p/ F) B, Y; W. T 2. 选择文件数据源中的文件,点击追加或覆盖
* d+ S+ p8 R/ _6 D: V 
! x( f- w, t" \ 3. 当选择的文件是EXCEL时,可以选择EXCEL文件中用户需要的工作簿,以及设置工作簿数据中的字段起始行及数据起始行
0 {, O" ~; q* F; s 
% a( C. d0 m6 U F
4. 进入数据预处理,可进行数据简单的处理后再将数据追加或覆盖到主题表中
' L5 o& V. ^) J2 l/ } b0 N+ U

; i' ]& |% ~0 }+ B) Q6 I
5. 点击追加或覆盖,设置字段对应关系,可点击按位置匹配或按名称匹配
5 Q7 n+ P" ]1 D

+ C% F! ^4 C/ C8 m% z6 r 也可针对某一个字段自行选择设置字段对应关系
0 c- }* {2 C! t0 f( w3 P

. H. l3 m6 `2 Y: a) Z 设置完字段对应关系后,点击确定,即可将进行预处理的文件数据追加或覆盖到主题表中
' X9 F( M: y' A4 h% V" }