3 [9 w- j, a" o2 J 如果大家对豌豆BI的数据预处理有一定了解的话,就知道数据预处理的简单易用性,可以在数据分析之前,处理数据不完整,重复,异常值等问题,通过简单的界面操作即可完成。通过对用户需求的分析,数据预处理增加了其他更好用的功能,本文将介绍这些简单易操作的功能。
# z& o) r' T/ o' Q 1. 字段信息统计
# f) G. {# l3 n4 \ 在查看主题表数据,或进行数据预处理时,可以查到表中所有字段的各种统计信息,如最大值、最小值、唯一值,缺失值个数,合计值,均值,方差值大小,及数据分布情况。
6 P3 a( ^/ b" V" Z
$ O, r; `$ D0 J% D1 }3 v' G2 k7 i, ? : X4 ^/ B8 L/ r4 K% P
打开凤凰新闻,查看更多高清图片
* I; i* n3 u: y. m2 U) T
$ H" x1 u& m$ o# ^, O 5 A, q. v; p1 X2 E% C. o6 {
2. 筛选生成新表
4 ~2 l* _& s5 ~
对某列数据进行筛选后,工具栏上出现“筛选结果另存为Sheet”按钮,点击后即可将筛选数据存成一张新的表进行处理
. z0 \. @& O' S6 C: W6 x
" M d7 ^9 c4 u( S: z, Y 同时,可以框选界面中的任意部分数据,右键,点击“框选另存为Sheet”,将框选部分存为一张新表处理
# j# v4 J1 p- b ]& V. o6 r ' a/ B9 {7 A- l& t: o" o& [
3. 生成关联数据
9 `7 l1 r) f0 N6 _% v- l% n 选择任意多张表进行关联,表之间可以进行关联后,选择表的字段生成一张新的表,新的表数据是根据设置的关联关系生成。
3 x/ x9 R& y3 s K" I0 V
1. 选择表做关联关系
# S1 o6 ^ Q4 Z* B2 c( x ( p3 v* Q3 T9 O! J/ l
2. 设置关联关系类型及关联字段
6 v) u7 C) i# y. h6 S p . l- H2 O9 q; S2 @1 e4 E& Z
3. 选择最终生成关联新表数据需要的字段
# O4 A- V6 f7 w# B! ^
4 W& b' ] p# n8 l) l 4. 主题表数据追加覆盖
6 B; v! k8 s0 f u
可以对主题表的数据进行追加或覆盖操作,此处是选择文件数据源中的文件数据,解析文件,通过设置字段对应关系,将文件中的数据追加或覆盖到主题表中。
% @: H/ K A$ h/ K9 D% W- V 1.操作入口,主题表列表中,主题表后面更多操作中的“追加覆盖数据”按钮:
' S6 {9 N v. M$ M8 s ' ?7 ?6 a8 Y( ]6 J$ \# W/ d
2. 选择文件数据源中的文件,点击追加或覆盖
* E2 {! K( ]0 |* c# ~
( M1 Y; I+ g% v5 S6 e 3. 当选择的文件是EXCEL时,可以选择EXCEL文件中用户需要的工作簿,以及设置工作簿数据中的字段起始行及数据起始行
, D ~; C6 g' B6 D1 n1 W* X8 q) s
( a, X/ i8 E/ C" t 4. 进入数据预处理,可进行数据简单的处理后再将数据追加或覆盖到主题表中
5 Z. l$ q0 L2 }3 ~; m$ u# @3 {
; B0 }" \( H9 c+ v+ ^& }; W
5. 点击追加或覆盖,设置字段对应关系,可点击按位置匹配或按名称匹配
6 q0 r8 Z D0 ^7 n2 ~' j! a ' B5 `3 v0 T* ?9 \
也可针对某一个字段自行选择设置字段对应关系
5 b" U8 y) Q! W4 d2 r' J8 A7 n
+ l5 V2 n) L/ L6 y# s# P: n
设置完字段对应关系后,点击确定,即可将进行预处理的文件数据追加或覆盖到主题表中
. P# R. s1 W5 X/ d