! Q' ^% ?9 M: Q2 {3 k
如果大家对豌豆BI的数据预处理有一定了解的话,就知道数据预处理的简单易用性,可以在数据分析之前,处理数据不完整,重复,异常值等问题,通过简单的界面操作即可完成。通过对用户需求的分析,数据预处理增加了其他更好用的功能,本文将介绍这些简单易操作的功能。
$ m7 F4 v# K* R. w6 H
1. 字段信息统计
. b. D* n/ [# T0 t6 y$ t1 x2 G 在查看主题表数据,或进行数据预处理时,可以查到表中所有字段的各种统计信息,如最大值、最小值、唯一值,缺失值个数,合计值,均值,方差值大小,及数据分布情况。
% e9 q0 W- q8 o \
% a4 O) y( ^# Y1 M% p9 j. e
: {( a- ~4 i, Z/ a6 P
打开凤凰新闻,查看更多高清图片
0 }3 y5 M2 N) J2 i& a
# w6 e5 G! o) _3 o# w. H5 j' i 9 Z1 R) R8 D+ K$ s, y, f: W% _ P
2. 筛选生成新表
' u% ^7 N$ B" l# @
对某列数据进行筛选后,工具栏上出现“筛选结果另存为Sheet”按钮,点击后即可将筛选数据存成一张新的表进行处理
2 \' u7 {* v+ [2 P" R: E/ z; H. u& J! A 
0 I3 W) V1 I S
同时,可以框选界面中的任意部分数据,右键,点击“框选另存为Sheet”,将框选部分存为一张新表处理
4 s- ], r* M2 r$ y- c# i8 n 
/ E' } i( R. _. P) i; c 3. 生成关联数据
E! T# ^; X" h6 R 选择任意多张表进行关联,表之间可以进行关联后,选择表的字段生成一张新的表,新的表数据是根据设置的关联关系生成。
* z6 Z5 x. j4 u4 r$ C4 P$ k
1. 选择表做关联关系
2 c n; f7 r- t: n 
( U" C" G4 H+ }( c/ @
2. 设置关联关系类型及关联字段
4 q: e, m3 O; W1 o L7 x% s

8 n" X) P3 H; b4 a7 n- q! R
3. 选择最终生成关联新表数据需要的字段
. H' E7 a' P2 W2 O 
' Q f! H3 g; i/ X7 W 4. 主题表数据追加覆盖
' t) [1 B; b5 [2 V: j 可以对主题表的数据进行追加或覆盖操作,此处是选择文件数据源中的文件数据,解析文件,通过设置字段对应关系,将文件中的数据追加或覆盖到主题表中。
4 y; v6 N6 }' v 1.操作入口,主题表列表中,主题表后面更多操作中的“追加覆盖数据”按钮:
% h4 [% O. {" V; L# z w$ v 
8 f2 R5 S- T f& b 2. 选择文件数据源中的文件,点击追加或覆盖
$ J; W7 U9 k: A& ~

; b3 A' C7 ]1 Y2 [7 k 3. 当选择的文件是EXCEL时,可以选择EXCEL文件中用户需要的工作簿,以及设置工作簿数据中的字段起始行及数据起始行
) T4 `" B8 Y9 X; Y 
x) x, j: W7 L& u# t
4. 进入数据预处理,可进行数据简单的处理后再将数据追加或覆盖到主题表中
0 D' P8 [# l2 u `8 l. y

4 V7 [4 Z: U* b# `! N 5. 点击追加或覆盖,设置字段对应关系,可点击按位置匹配或按名称匹配
1 g3 n0 n9 q6 M* t 
. O) S, I" k) ?. H7 ?+ k% F 也可针对某一个字段自行选择设置字段对应关系
$ D: S; C; Y" ~: n+ n 
2 n, f+ Y& e' q' `
设置完字段对应关系后,点击确定,即可将进行预处理的文件数据追加或覆盖到主题表中
! J4 ~5 K" n l