1 U2 t' P2 N* y' z& [& t- o4 r3 ^ 如果大家对豌豆BI的数据预处理有一定了解的话,就知道数据预处理的简单易用性,可以在数据分析之前,处理数据不完整,重复,异常值等问题,通过简单的界面操作即可完成。通过对用户需求的分析,数据预处理增加了其他更好用的功能,本文将介绍这些简单易操作的功能。
- ~- W8 Z8 _# S 1. 字段信息统计
! X, E# f& H O5 I8 V& v! u5 g
在查看主题表数据,或进行数据预处理时,可以查到表中所有字段的各种统计信息,如最大值、最小值、唯一值,缺失值个数,合计值,均值,方差值大小,及数据分布情况。
9 P. H( g5 [* L. Y! k
6 o9 b* F, n- d
/ v5 j' B2 f. r
打开凤凰新闻,查看更多高清图片
* m$ G. k( W6 O& r9 a) V ( F3 @2 F8 T. W, W( `, V$ ^0 |
6 s6 r D3 c0 Y' _/ }4 R
2. 筛选生成新表
! j( ]2 Z" x5 `- H; X 对某列数据进行筛选后,工具栏上出现“筛选结果另存为Sheet”按钮,点击后即可将筛选数据存成一张新的表进行处理
' x) z2 e( w* I, k8 I1 k 
: c( B1 p9 q1 S; x* g( E
同时,可以框选界面中的任意部分数据,右键,点击“框选另存为Sheet”,将框选部分存为一张新表处理
/ [. {' k! x3 w1 Z: P( @+ }$ J 
u) Y" C3 w! G7 v5 u% ]
3. 生成关联数据
& a) W1 e# B: F! c L7 z O 选择任意多张表进行关联,表之间可以进行关联后,选择表的字段生成一张新的表,新的表数据是根据设置的关联关系生成。
! K( a5 m' z" H8 c& D( q1 N6 W 1. 选择表做关联关系
* }) w8 h% {* R# s 
& Z1 Q7 a, f5 _% F7 p! x1 ]
2. 设置关联关系类型及关联字段
1 o7 x( X6 y9 x$ I! \

- W2 u0 @$ |4 G3 P( P 3. 选择最终生成关联新表数据需要的字段
: X; u7 r" o( [8 e8 C: H: K( X" y 
4 G) S6 f! `8 c3 x& g M. G
4. 主题表数据追加覆盖
. T) v" R3 P8 i( [; \, v" B 可以对主题表的数据进行追加或覆盖操作,此处是选择文件数据源中的文件数据,解析文件,通过设置字段对应关系,将文件中的数据追加或覆盖到主题表中。
& M# b/ t, S7 A, m; q7 o 1.操作入口,主题表列表中,主题表后面更多操作中的“追加覆盖数据”按钮:
! x+ @# ^$ V+ U+ ^0 N 
) V9 h/ k* m. D. h/ @! a \
2. 选择文件数据源中的文件,点击追加或覆盖
a- @9 {3 @, ?* e# M+ A! U( H 
' ^ U" M+ D( J& z: z 3. 当选择的文件是EXCEL时,可以选择EXCEL文件中用户需要的工作簿,以及设置工作簿数据中的字段起始行及数据起始行
7 a6 Z: Y8 `. [& g* R/ B# D

: H9 } [1 S# } 4. 进入数据预处理,可进行数据简单的处理后再将数据追加或覆盖到主题表中
- ~2 ?& N( F( B6 h- i

6 W2 H+ {2 I& t1 l) M. T 5. 点击追加或覆盖,设置字段对应关系,可点击按位置匹配或按名称匹配
3 o$ O6 Y; ~, f. K! H% L 
5 X- V- k) b9 b8 t- R( u# Z% I
也可针对某一个字段自行选择设置字段对应关系
- g0 y; U# N) _3 T7 {" k 
& w- D. u! |" I0 Q6 m: A. x+ x 设置完字段对应关系后,点击确定,即可将进行预处理的文件数据追加或覆盖到主题表中
* z* W# d8 H) M0 \