( C5 F" R) j- g7 a( l6 X 如果大家对豌豆BI的数据预处理有一定了解的话,就知道数据预处理的简单易用性,可以在数据分析之前,处理数据不完整,重复,异常值等问题,通过简单的界面操作即可完成。通过对用户需求的分析,数据预处理增加了其他更好用的功能,本文将介绍这些简单易操作的功能。
2 b+ ^, S; y: S% K# j) T
1. 字段信息统计
6 K# \: e0 K: [. f. }: b/ G 在查看主题表数据,或进行数据预处理时,可以查到表中所有字段的各种统计信息,如最大值、最小值、唯一值,缺失值个数,合计值,均值,方差值大小,及数据分布情况。
0 m& _8 B% T/ P5 g
7 O7 z% g9 D- t. d! ^0 y7 B5 d F$ I" d3 u* `. X- _7 }
打开凤凰新闻,查看更多高清图片
' o6 J" C2 q: i! c* J5 ?2 r
6 {. p5 Y, m& L' A9 H, l
, g. Z6 e7 u- ?! [$ N6 M3 J 2. 筛选生成新表
3 F- w/ N8 g6 N) E, U; l9 x
对某列数据进行筛选后,工具栏上出现“筛选结果另存为Sheet”按钮,点击后即可将筛选数据存成一张新的表进行处理
1 Q7 C3 y N. e! A ?. J7 S

9 {) e" \+ p2 J* _$ @# ~0 E: z6 m 同时,可以框选界面中的任意部分数据,右键,点击“框选另存为Sheet”,将框选部分存为一张新表处理
3 q7 _( U( k1 K( K4 \! J+ s' W

+ G, S5 |$ t9 [ b K 3. 生成关联数据
1 P( I1 C! ?. G' u
选择任意多张表进行关联,表之间可以进行关联后,选择表的字段生成一张新的表,新的表数据是根据设置的关联关系生成。
6 _" l& p7 Y: G 1. 选择表做关联关系
# K9 Q& Z' \! y/ q. K

+ \! p) T. O) {8 x; A: ?
2. 设置关联关系类型及关联字段
( L2 B1 u- Q* p+ L* f# z 
" ?3 C' A A4 \ B) v9 z) q
3. 选择最终生成关联新表数据需要的字段
# G0 U" H/ o9 x v% K

b7 f. {" G$ J3 N6 B. ^
4. 主题表数据追加覆盖
9 {. Y. p& t" k 可以对主题表的数据进行追加或覆盖操作,此处是选择文件数据源中的文件数据,解析文件,通过设置字段对应关系,将文件中的数据追加或覆盖到主题表中。
. q' X1 C/ `. g 1.操作入口,主题表列表中,主题表后面更多操作中的“追加覆盖数据”按钮:
/ \: V* s5 h- A7 |. G

4 Z+ n) Z) q# W+ ~& Q' } 2. 选择文件数据源中的文件,点击追加或覆盖
* h7 A' M# B# J' g4 _" D

1 c4 p( E! N6 Y |! _, ~3 o
3. 当选择的文件是EXCEL时,可以选择EXCEL文件中用户需要的工作簿,以及设置工作簿数据中的字段起始行及数据起始行
# h q4 J" i% e' i1 H; w7 g$ Q4 D

8 L# i1 G9 A0 r8 p! P5 G: v9 O/ U
4. 进入数据预处理,可进行数据简单的处理后再将数据追加或覆盖到主题表中
6 q1 Z. t0 m: } i, S* ]' U' Y4 f1 o 
7 n+ g+ L* h( c: N1 `4 R9 O 5. 点击追加或覆盖,设置字段对应关系,可点击按位置匹配或按名称匹配
\8 F+ c, f- N W) k

0 x0 P$ e6 A, o; Z! s 也可针对某一个字段自行选择设置字段对应关系
! D: Q" x( B W7 n! @8 C c 
* T( }; u2 ~! f
设置完字段对应关系后,点击确定,即可将进行预处理的文件数据追加或覆盖到主题表中
( j7 G9 k# J$ W: M/ I# Q8 q