0 J7 B5 ^* Q" d+ U/ i* `: n8 _ 如果大家对豌豆BI的数据预处理有一定了解的话,就知道数据预处理的简单易用性,可以在数据分析之前,处理数据不完整,重复,异常值等问题,通过简单的界面操作即可完成。通过对用户需求的分析,数据预处理增加了其他更好用的功能,本文将介绍这些简单易操作的功能。
; h, j2 U# ~; E% |& U2 B9 x0 m 1. 字段信息统计
8 {) J( ~% d7 t! n( O& M
在查看主题表数据,或进行数据预处理时,可以查到表中所有字段的各种统计信息,如最大值、最小值、唯一值,缺失值个数,合计值,均值,方差值大小,及数据分布情况。
. ~# }9 ?7 u/ S6 ~6 l4 ~3 G4 w; w. I" ?
/ E3 r; s- T5 @$ k1 E5 o
9 B& m; B, \3 t# A: V1 E
打开凤凰新闻,查看更多高清图片
C4 X9 X' V3 S! f$ l4 [% l' V / N0 Y9 M. I/ l9 I7 D
6 l5 I$ ^4 a2 j/ z2 d6 D
2. 筛选生成新表
2 |) ]$ N; H7 T& Y/ K! R" D! z+ @
对某列数据进行筛选后,工具栏上出现“筛选结果另存为Sheet”按钮,点击后即可将筛选数据存成一张新的表进行处理
0 f, B) ]2 }) h$ t6 | 
7 L* F7 w1 Q; q3 O+ ]
同时,可以框选界面中的任意部分数据,右键,点击“框选另存为Sheet”,将框选部分存为一张新表处理
* |7 c: _( t2 K2 G9 N

" H. j6 r& A7 G" K; }
3. 生成关联数据
/ d% y2 g- Y1 I9 E. C9 i+ J( I 选择任意多张表进行关联,表之间可以进行关联后,选择表的字段生成一张新的表,新的表数据是根据设置的关联关系生成。
6 y- q% c, e7 y; }# J8 B 1. 选择表做关联关系
: L1 ~( _% R0 b, N5 Z4 y: b7 u

% A; ~) [ A/ o) ~& v$ j- y- T' }
2. 设置关联关系类型及关联字段
" b8 M1 y7 b/ q

' q$ Y8 R" z- j8 |6 ?1 b3 |+ d i
3. 选择最终生成关联新表数据需要的字段
8 Y! O. j! `6 |2 _+ L 
8 q2 |& s& R1 [
4. 主题表数据追加覆盖
7 r) [( _ O. P5 B 可以对主题表的数据进行追加或覆盖操作,此处是选择文件数据源中的文件数据,解析文件,通过设置字段对应关系,将文件中的数据追加或覆盖到主题表中。
7 |8 U: n3 i2 m I. j# t
1.操作入口,主题表列表中,主题表后面更多操作中的“追加覆盖数据”按钮:
! z& L1 o, Y: r; W

! r, G) G1 [% o6 ^) D 2. 选择文件数据源中的文件,点击追加或覆盖
/ ?4 L$ E% ]5 P3 j$ j' D/ C

9 o8 p+ b% H' Z" U5 x
3. 当选择的文件是EXCEL时,可以选择EXCEL文件中用户需要的工作簿,以及设置工作簿数据中的字段起始行及数据起始行
& y0 R% ?. m8 O) s% G" }

+ B8 n* ~4 ]# M7 d0 n 4. 进入数据预处理,可进行数据简单的处理后再将数据追加或覆盖到主题表中
) z% }* e8 J3 Z% U n4 g3 S/ `' h9 N |! a 
# E/ z# }: v, |5 n7 T
5. 点击追加或覆盖,设置字段对应关系,可点击按位置匹配或按名称匹配
~' p4 v8 F5 x8 }! ~; q2 H 
. G0 ?/ z4 W# m 也可针对某一个字段自行选择设置字段对应关系
3 K* J' o' ?& y1 O j; K 
/ G' l9 v2 A9 L. O
设置完字段对应关系后,点击确定,即可将进行预处理的文件数据追加或覆盖到主题表中
6 B& }1 E1 r5 F' |1 a8 B