8 g$ U* b! A: _+ g0 u0 {% k/ d) _
如果大家对豌豆BI的数据预处理有一定了解的话,就知道数据预处理的简单易用性,可以在数据分析之前,处理数据不完整,重复,异常值等问题,通过简单的界面操作即可完成。通过对用户需求的分析,数据预处理增加了其他更好用的功能,本文将介绍这些简单易操作的功能。
" E P# ^( ~9 }6 f
1. 字段信息统计
7 a+ a0 l3 U- v* Q5 K. p& P% Y
在查看主题表数据,或进行数据预处理时,可以查到表中所有字段的各种统计信息,如最大值、最小值、唯一值,缺失值个数,合计值,均值,方差值大小,及数据分布情况。
+ R a+ a5 Q- S# j# P9 [
) `$ _1 b4 {- S- b( \5 Y- m
. z9 i0 ?; a& \0 L 打开凤凰新闻,查看更多高清图片
' @' m0 f& u. p2 J# ]/ y# b6 F 0 h1 [: l+ Y& U7 @) `7 I
3 B/ C* b) C7 E* V1 n" t" G: m 2. 筛选生成新表
; w* b/ T `3 x5 Q6 x8 k0 H5 p
对某列数据进行筛选后,工具栏上出现“筛选结果另存为Sheet”按钮,点击后即可将筛选数据存成一张新的表进行处理
* N q! P4 c; B2 e

: ]$ Q1 j2 J8 H8 Q$ H/ ]/ H 同时,可以框选界面中的任意部分数据,右键,点击“框选另存为Sheet”,将框选部分存为一张新表处理
) {0 h* ?) \5 [2 B( ] 
/ ~% \2 g" e# F W 3. 生成关联数据
; Q+ U* m' e6 T7 B0 T/ I! O1 e
选择任意多张表进行关联,表之间可以进行关联后,选择表的字段生成一张新的表,新的表数据是根据设置的关联关系生成。
& [9 J6 k8 U5 m7 T! u6 m1 U) Z" ?
1. 选择表做关联关系
' k+ c# X1 O6 e b 
. _+ b) t8 x) g5 q$ b 2. 设置关联关系类型及关联字段
: w/ Y$ p- p2 T w1 B) J

6 L [1 P$ m, ^1 o! S3 J& [1 f
3. 选择最终生成关联新表数据需要的字段
# e; y- Q6 l7 R* @0 n2 a h: V 
5 X- \: a4 Y3 t% L 4. 主题表数据追加覆盖
8 h$ @) r3 W' ]3 g& g 可以对主题表的数据进行追加或覆盖操作,此处是选择文件数据源中的文件数据,解析文件,通过设置字段对应关系,将文件中的数据追加或覆盖到主题表中。
/ n b3 |& _4 Z. j* x0 W
1.操作入口,主题表列表中,主题表后面更多操作中的“追加覆盖数据”按钮:
5 E9 g, n9 b7 j. B; Y( D4 b

. i0 H, a) i- P6 f+ f
2. 选择文件数据源中的文件,点击追加或覆盖
9 B1 C6 A [3 p$ q

" z1 h8 E7 T" @7 Y' h1 Z: a
3. 当选择的文件是EXCEL时,可以选择EXCEL文件中用户需要的工作簿,以及设置工作簿数据中的字段起始行及数据起始行
7 S6 U1 ?3 `8 u1 x0 m 
" w' b& V6 p3 c0 o6 t
4. 进入数据预处理,可进行数据简单的处理后再将数据追加或覆盖到主题表中
. f, }& @2 @1 F- z4 H

7 r+ c d6 @3 A9 N* ` 5. 点击追加或覆盖,设置字段对应关系,可点击按位置匹配或按名称匹配
& o0 M# c s U/ U" u

; ]; p- x& g& D7 Z 也可针对某一个字段自行选择设置字段对应关系
$ ?" O/ M# U' B2 | 
2 `0 i% ^. P* v! X5 N# r. p
设置完字段对应关系后,点击确定,即可将进行预处理的文件数据追加或覆盖到主题表中
5 D1 M$ X* B0 I* J" R, t