8 {. _: D1 ^) i! y2 F4 E% m
如果大家对豌豆BI的数据预处理有一定了解的话,就知道数据预处理的简单易用性,可以在数据分析之前,处理数据不完整,重复,异常值等问题,通过简单的界面操作即可完成。通过对用户需求的分析,数据预处理增加了其他更好用的功能,本文将介绍这些简单易操作的功能。
4 c! m* V% R2 C! D d 1. 字段信息统计
. S0 T5 V& c9 ? 在查看主题表数据,或进行数据预处理时,可以查到表中所有字段的各种统计信息,如最大值、最小值、唯一值,缺失值个数,合计值,均值,方差值大小,及数据分布情况。
& c% a: b8 f. y- F
) G) I" ^2 R% Z4 s! A: h! @6 m: v
! b# H- v% u$ [0 ^0 W$ p
打开凤凰新闻,查看更多高清图片
' o$ l4 @/ O# p+ p0 y
5 V7 I& G" R$ | # w# c' h# t/ t
2. 筛选生成新表
6 l( j/ s3 X% A1 \& A. l ]. `
对某列数据进行筛选后,工具栏上出现“筛选结果另存为Sheet”按钮,点击后即可将筛选数据存成一张新的表进行处理
0 E, g3 D+ N3 j" j4 v

2 R, V. }0 O8 P
同时,可以框选界面中的任意部分数据,右键,点击“框选另存为Sheet”,将框选部分存为一张新表处理
9 S8 A5 D4 P/ V, K

& i4 I5 q. i3 p# Q 3. 生成关联数据
% d/ N4 B* T/ {* Q- t 选择任意多张表进行关联,表之间可以进行关联后,选择表的字段生成一张新的表,新的表数据是根据设置的关联关系生成。
% U. z9 X' x! i1 u, | 1. 选择表做关联关系
& x) R$ b5 e' m, e; |5 \ 
7 R h/ j* @( f
2. 设置关联关系类型及关联字段
8 E" x+ Q/ ?5 |* A6 ^1 J1 j, {6 h- D 
1 _9 f, p( k- Q, q1 L2 S" b& K 3. 选择最终生成关联新表数据需要的字段
) y: z7 l6 P8 E$ x' O" N0 p$ m } 
# e, l' w, v1 s9 {7 @4 G1 |
4. 主题表数据追加覆盖
- B2 A2 _# o! f9 M8 t* a
可以对主题表的数据进行追加或覆盖操作,此处是选择文件数据源中的文件数据,解析文件,通过设置字段对应关系,将文件中的数据追加或覆盖到主题表中。
/ C0 }5 q0 l9 z2 ]5 |$ ]3 Q- c
1.操作入口,主题表列表中,主题表后面更多操作中的“追加覆盖数据”按钮:
& S7 k: V2 m8 @& B- Y+ l 
. A5 W8 j" b- A$ l 2. 选择文件数据源中的文件,点击追加或覆盖
$ K& k8 @3 X8 _+ H$ @

" _4 v* r6 f; _2 T, S8 K/ q
3. 当选择的文件是EXCEL时,可以选择EXCEL文件中用户需要的工作簿,以及设置工作簿数据中的字段起始行及数据起始行
% N9 W/ V4 g8 v. Y, _

" @- D" Q9 a( R: o* q9 u4 j 4. 进入数据预处理,可进行数据简单的处理后再将数据追加或覆盖到主题表中
; S) i+ E1 M Y, [! J9 ~# h5 f 
4 d5 I: W! J1 T. q, }5 i. H8 y
5. 点击追加或覆盖,设置字段对应关系,可点击按位置匹配或按名称匹配
/ ]3 g1 a& \* B8 {4 K/ t 
% v( s) F7 s: h a% a
也可针对某一个字段自行选择设置字段对应关系
$ G) C ~+ M" G3 y( m

7 i5 V# ], ~ r9 |& s& Y 设置完字段对应关系后,点击确定,即可将进行预处理的文件数据追加或覆盖到主题表中
- J* U& a9 W M+ a8 R6 I$ s! v