: ~- U7 l( I# l1 s3 Q ~: [
如果大家对豌豆BI的数据预处理有一定了解的话,就知道数据预处理的简单易用性,可以在数据分析之前,处理数据不完整,重复,异常值等问题,通过简单的界面操作即可完成。通过对用户需求的分析,数据预处理增加了其他更好用的功能,本文将介绍这些简单易操作的功能。
( Z* h$ \, _0 A# I! q& R& T4 B 1. 字段信息统计
+ x( o9 d4 Q7 u6 K( U
在查看主题表数据,或进行数据预处理时,可以查到表中所有字段的各种统计信息,如最大值、最小值、唯一值,缺失值个数,合计值,均值,方差值大小,及数据分布情况。
. ] ~0 g; D2 X2 X E# E8 R7 v3 f
3 Q. Q$ s& N0 V5 e$ m7 H ) I, a& I$ B. Y: I$ X
打开凤凰新闻,查看更多高清图片
# G. N/ J( m3 ~* I7 v4 O$ K
$ @1 O3 `6 N- V0 m) W $ d7 P' F+ Y" \) B3 |6 G
2. 筛选生成新表
8 o2 `; Z8 m% f! h5 z1 K E
对某列数据进行筛选后,工具栏上出现“筛选结果另存为Sheet”按钮,点击后即可将筛选数据存成一张新的表进行处理
, c% ~5 ], @. X, n 
; M' y ]- ?+ c0 o; Q0 \: S$ r 同时,可以框选界面中的任意部分数据,右键,点击“框选另存为Sheet”,将框选部分存为一张新表处理
: s+ [1 N+ J& O$ Y" M' E

4 c! j0 U( ]4 n; N, Z3 g
3. 生成关联数据
9 X2 M8 j( g! o9 P 选择任意多张表进行关联,表之间可以进行关联后,选择表的字段生成一张新的表,新的表数据是根据设置的关联关系生成。
7 f6 t$ Y: W- r" \& ?$ Q9 b3 t! Y2 z* @, {
1. 选择表做关联关系
9 P. X" i/ T% j7 g2 ]" o- i

. l8 V5 ]7 c% ~, a
2. 设置关联关系类型及关联字段
7 X/ }/ z3 J6 \1 `0 _1 X5 U; z 
( v2 f# { o. K. q) C
3. 选择最终生成关联新表数据需要的字段
' k2 T+ w+ i* x: M* j 
4 ~$ G7 B6 b9 @. _* H: C 4. 主题表数据追加覆盖
4 F& ^' ~" i: P8 G' h 可以对主题表的数据进行追加或覆盖操作,此处是选择文件数据源中的文件数据,解析文件,通过设置字段对应关系,将文件中的数据追加或覆盖到主题表中。
* r- P7 S9 b9 U; I$ ~: _" U: } 1.操作入口,主题表列表中,主题表后面更多操作中的“追加覆盖数据”按钮:
$ B$ ?3 ~. z# X8 u4 x0 `! _7 W 
; U6 F* {& t$ A* d
2. 选择文件数据源中的文件,点击追加或覆盖
3 m0 f/ ?% t& N4 t8 f0 ? 
- J7 w% k0 N( `* y# K- R- V; D
3. 当选择的文件是EXCEL时,可以选择EXCEL文件中用户需要的工作簿,以及设置工作簿数据中的字段起始行及数据起始行
. q0 J, r$ H* `+ C

/ i) P5 h' m5 j; n! x* l
4. 进入数据预处理,可进行数据简单的处理后再将数据追加或覆盖到主题表中
/ y/ j2 q0 t: M3 R/ L: U" p& j 
3 v" e# [9 R. L+ ?. n. p
5. 点击追加或覆盖,设置字段对应关系,可点击按位置匹配或按名称匹配
; m0 @" Q- G8 H% a/ B ]2 K! W* k: l 
% y. ?% G" B2 a: M8 G- _( H 也可针对某一个字段自行选择设置字段对应关系
( ^# b. K; j3 \' s9 s$ t( X1 E! c

2 L; q5 x% k* e" Q. G 设置完字段对应关系后,点击确定,即可将进行预处理的文件数据追加或覆盖到主题表中
6 e/ C; Q- K- p; n+ K% ^