9 C F" t: }+ z% e. h; @5 f9 | 如果大家对豌豆BI的数据预处理有一定了解的话,就知道数据预处理的简单易用性,可以在数据分析之前,处理数据不完整,重复,异常值等问题,通过简单的界面操作即可完成。通过对用户需求的分析,数据预处理增加了其他更好用的功能,本文将介绍这些简单易操作的功能。
& ]) l7 g$ }( D
1. 字段信息统计
* S. G( K2 f( t+ b: V; ]: J
在查看主题表数据,或进行数据预处理时,可以查到表中所有字段的各种统计信息,如最大值、最小值、唯一值,缺失值个数,合计值,均值,方差值大小,及数据分布情况。
# s! z! f2 d X6 @# j; p
) B+ _3 M* w5 b2 @, b2 o! A; L
9 }5 P# x3 R1 g 打开凤凰新闻,查看更多高清图片
5 x7 N* a3 Q: \" o k( \
, {; u3 o& B# e9 J
3 r1 S6 k& k) f0 j" s: j& e$ j) c
2. 筛选生成新表
$ F! y' v8 L1 |/ V* L6 M 对某列数据进行筛选后,工具栏上出现“筛选结果另存为Sheet”按钮,点击后即可将筛选数据存成一张新的表进行处理
+ J+ }- h5 z, ~
0 p8 k) @! W9 G 同时,可以框选界面中的任意部分数据,右键,点击“框选另存为Sheet”,将框选部分存为一张新表处理
& ?4 \" V L5 o1 y2 h5 }4 h
) y- B7 P* T' v4 t ?3 V( }
3. 生成关联数据
. h* T3 l: p* x4 j0 K4 M) U
选择任意多张表进行关联,表之间可以进行关联后,选择表的字段生成一张新的表,新的表数据是根据设置的关联关系生成。
. q0 }. Q8 H; ]4 s4 g) _
1. 选择表做关联关系
9 G7 D. g8 S/ g; Z( H1 O3 R
; s! t- M2 p( V 2. 设置关联关系类型及关联字段
2 T4 q' `- ?; t( y1 _) n$ j # Z3 X# @# [4 L0 Z- Z4 _: Q
3. 选择最终生成关联新表数据需要的字段
) G: @ p5 F; B' `2 ]4 x
' O; N9 w6 t6 \1 o r" v: U! _ 4. 主题表数据追加覆盖
" D$ N4 ?& Y0 }
可以对主题表的数据进行追加或覆盖操作,此处是选择文件数据源中的文件数据,解析文件,通过设置字段对应关系,将文件中的数据追加或覆盖到主题表中。
8 L+ x6 u6 n: W$ r) v% V! H3 r* W 1.操作入口,主题表列表中,主题表后面更多操作中的“追加覆盖数据”按钮:
6 w2 E2 {1 N( ~7 q; `: W( S 0 ^0 z/ i7 B, n
2. 选择文件数据源中的文件,点击追加或覆盖
) k( G+ m* F7 [% ~5 v! w, S1 u7 B
) ` K* Z7 P8 T6 T) H, l 3. 当选择的文件是EXCEL时,可以选择EXCEL文件中用户需要的工作簿,以及设置工作簿数据中的字段起始行及数据起始行
% V8 {( g0 Q7 l. \) [' p ]
6 R: x% F8 u. F, S; w( J 4. 进入数据预处理,可进行数据简单的处理后再将数据追加或覆盖到主题表中
3 X5 u a& m2 _5 @, m) [9 J: j6 _
! }. A2 w1 p1 ]# a 5. 点击追加或覆盖,设置字段对应关系,可点击按位置匹配或按名称匹配
Z. A7 Z" W/ H+ ^4 J! E
5 m8 j2 A& I2 I8 c4 b6 t( t 也可针对某一个字段自行选择设置字段对应关系
5 p) B7 _- E* m) j7 Z
5 b2 G! ?; B% k: q* G% ]( ?3 X
设置完字段对应关系后,点击确定,即可将进行预处理的文件数据追加或覆盖到主题表中
9 j9 ~( {2 i+ C3 z1 Q2 x