$ j/ u/ A, m2 w% b: r8 i' X9 L% m0 Z. } 如果大家对豌豆BI的数据预处理有一定了解的话,就知道数据预处理的简单易用性,可以在数据分析之前,处理数据不完整,重复,异常值等问题,通过简单的界面操作即可完成。通过对用户需求的分析,数据预处理增加了其他更好用的功能,本文将介绍这些简单易操作的功能。
9 F2 W9 n8 j) [2 g8 ]4 Q! S
1. 字段信息统计
; |" x! f3 f( V r4 c$ E
在查看主题表数据,或进行数据预处理时,可以查到表中所有字段的各种统计信息,如最大值、最小值、唯一值,缺失值个数,合计值,均值,方差值大小,及数据分布情况。
% `( @3 ~) a6 L- Z. A) Z
. P# n4 _: p3 F3 r 0 W& y" y( }5 V) y
打开凤凰新闻,查看更多高清图片
|7 t4 ] t; g E$ T- \( _
8 o3 P' g7 W/ ~! Z
. f/ |% C9 H# u( M4 W$ s* V
2. 筛选生成新表
& | c$ H, r6 R+ f3 R
对某列数据进行筛选后,工具栏上出现“筛选结果另存为Sheet”按钮,点击后即可将筛选数据存成一张新的表进行处理
6 b1 v1 B6 x; M. G7 S

4 U" }, K! W4 B: Q
同时,可以框选界面中的任意部分数据,右键,点击“框选另存为Sheet”,将框选部分存为一张新表处理
3 N4 T) B% c9 m& R# X. q 
# V5 k7 n' c4 v( n0 R5 r 3. 生成关联数据
1 z$ X; a' C6 i* r8 r
选择任意多张表进行关联,表之间可以进行关联后,选择表的字段生成一张新的表,新的表数据是根据设置的关联关系生成。
" r* {4 o; {, p3 P" g
1. 选择表做关联关系
- P$ @( J' p _9 V! f8 u 
, d! n& T/ R1 n8 Z 2. 设置关联关系类型及关联字段
; L q% X4 g! q, f$ x 
" N& ?- ?! s! Y# g2 e# A 3. 选择最终生成关联新表数据需要的字段
# W$ X% o; O* W4 o( `

, b, r: H$ b: G: ]
4. 主题表数据追加覆盖
5 \/ j# p9 g( j" K `! J8 j
可以对主题表的数据进行追加或覆盖操作,此处是选择文件数据源中的文件数据,解析文件,通过设置字段对应关系,将文件中的数据追加或覆盖到主题表中。
W& L4 T/ o4 T8 ^" M/ X
1.操作入口,主题表列表中,主题表后面更多操作中的“追加覆盖数据”按钮:
& u# W( G' j3 Y 
( u+ w# o1 ~$ a- }- H( y- J 2. 选择文件数据源中的文件,点击追加或覆盖
6 W8 K; T' z# R) |; z" ~ 
5 W2 a$ w. J6 m4 Z' U. u
3. 当选择的文件是EXCEL时,可以选择EXCEL文件中用户需要的工作簿,以及设置工作簿数据中的字段起始行及数据起始行
! J1 k- t' j" h6 ^3 e

- V) `4 J1 k* \9 b, _ 4. 进入数据预处理,可进行数据简单的处理后再将数据追加或覆盖到主题表中
}. q5 @1 O5 c5 X3 x

+ Y5 e0 b/ R+ I) Z5 H9 p- d; Z 5. 点击追加或覆盖,设置字段对应关系,可点击按位置匹配或按名称匹配
5 g6 [# R3 T& t" Q$ s

5 ]4 R% j7 p! X+ a# _0 `; ?: l
也可针对某一个字段自行选择设置字段对应关系
6 `8 S: _( S$ j2 o- W' P 
3 r2 x$ V* L8 x/ `# f N
设置完字段对应关系后,点击确定,即可将进行预处理的文件数据追加或覆盖到主题表中
9 L# p9 I. o! H4 d( v7 r, E+ z