0 o4 F% n1 |( \- r( N* i 如果大家对豌豆BI的数据预处理有一定了解的话,就知道数据预处理的简单易用性,可以在数据分析之前,处理数据不完整,重复,异常值等问题,通过简单的界面操作即可完成。通过对用户需求的分析,数据预处理增加了其他更好用的功能,本文将介绍这些简单易操作的功能。
2 `5 M% q9 S* s' S
1. 字段信息统计
- e3 D* C- q2 @4 t, C 在查看主题表数据,或进行数据预处理时,可以查到表中所有字段的各种统计信息,如最大值、最小值、唯一值,缺失值个数,合计值,均值,方差值大小,及数据分布情况。
% ?' b9 o/ ?# g4 a% e , ?5 P8 ]# J' O* ~& v+ _' h+ p
/ [& Y% e$ X6 e6 ?
打开凤凰新闻,查看更多高清图片
( J/ ^: v( K) x
, ]' k, i, n0 _; X6 B& r9 L2 l8 ~
5 c2 W2 E& ~ s# h8 H
2. 筛选生成新表
u$ P# Y8 T" G4 X8 j% \9 i
对某列数据进行筛选后,工具栏上出现“筛选结果另存为Sheet”按钮,点击后即可将筛选数据存成一张新的表进行处理
) L# h& Y1 M) y. F' l & P0 O) h" b- W3 a) ?
同时,可以框选界面中的任意部分数据,右键,点击“框选另存为Sheet”,将框选部分存为一张新表处理
7 S: V% U) m U3 B# k
+ d" o- K" U- T2 k, ]& `. q+ {- Q 3. 生成关联数据
" F1 v) E0 ~6 g) Z3 z
选择任意多张表进行关联,表之间可以进行关联后,选择表的字段生成一张新的表,新的表数据是根据设置的关联关系生成。
+ v! j3 m4 O) }8 ]5 B
1. 选择表做关联关系
+ l' w( v0 h* r: h& s( y# a. h& ~
% ?/ C4 n4 w" d, }, Q9 Z$ Z3 Z7 o# V 2. 设置关联关系类型及关联字段
( ?. C' S% M: I1 V& u1 g
: a' h) A0 m' ~& U# J' I 3. 选择最终生成关联新表数据需要的字段
# V4 [1 S% M# I: X8 X' ~# V
0 R- N( _1 R3 ~' R" B 4. 主题表数据追加覆盖
" U2 ^) C3 t/ F% I9 F2 A
可以对主题表的数据进行追加或覆盖操作,此处是选择文件数据源中的文件数据,解析文件,通过设置字段对应关系,将文件中的数据追加或覆盖到主题表中。
' m8 H2 e' ]# X" s0 x3 M, p 1.操作入口,主题表列表中,主题表后面更多操作中的“追加覆盖数据”按钮:
5 \# Y6 o: Y0 Q1 \% n* Y 0 B: X- O8 P& Z# [
2. 选择文件数据源中的文件,点击追加或覆盖
$ k5 \) }$ p- c# g+ y
9 Y- l) L1 ~. b0 b& p
3. 当选择的文件是EXCEL时,可以选择EXCEL文件中用户需要的工作簿,以及设置工作簿数据中的字段起始行及数据起始行
h4 o3 e. A: @
4 M/ p& R7 k5 y p& Z8 L
4. 进入数据预处理,可进行数据简单的处理后再将数据追加或覆盖到主题表中
e* g2 F1 P7 |$ a z7 J6 z- _
; ]5 K1 i0 w7 I; a
5. 点击追加或覆盖,设置字段对应关系,可点击按位置匹配或按名称匹配
3 T$ n4 J) q1 V' p" M' A3 k 5 R$ t: [) `+ Y9 Y0 F
也可针对某一个字段自行选择设置字段对应关系
! H j" R. f$ r i% Z ; T/ C6 j$ W3 Y9 }8 B3 p7 U
设置完字段对应关系后,点击确定,即可将进行预处理的文件数据追加或覆盖到主题表中
% w# u+ T. X- j' }/ c