6 g- P8 |, X/ s7 H9 X
如果大家对豌豆BI的数据预处理有一定了解的话,就知道数据预处理的简单易用性,可以在数据分析之前,处理数据不完整,重复,异常值等问题,通过简单的界面操作即可完成。通过对用户需求的分析,数据预处理增加了其他更好用的功能,本文将介绍这些简单易操作的功能。
0 U- ~4 v0 h& E9 C# ]
1. 字段信息统计
$ s& v3 _- o* Z7 A+ ?" H 在查看主题表数据,或进行数据预处理时,可以查到表中所有字段的各种统计信息,如最大值、最小值、唯一值,缺失值个数,合计值,均值,方差值大小,及数据分布情况。
" e' a' }: J6 G6 K5 y) ]9 ~- A
2 u2 z$ f4 O& ], a ? W 4 K8 g2 R$ C- d6 g/ h
打开凤凰新闻,查看更多高清图片
3 j1 x! i# y$ k l
5 m) Q0 C3 U6 f1 O* N! b' D ; \1 m4 [8 ]% B \
2. 筛选生成新表
1 g( m7 Y6 e1 U* G0 U: e8 k4 ^ 对某列数据进行筛选后,工具栏上出现“筛选结果另存为Sheet”按钮,点击后即可将筛选数据存成一张新的表进行处理
( D" T6 d* [$ ~* a2 w

; c: {, T! B- o9 C5 B7 \
同时,可以框选界面中的任意部分数据,右键,点击“框选另存为Sheet”,将框选部分存为一张新表处理
, `) u4 c) S0 q( D5 \' u 
# h+ A8 m l7 M 3. 生成关联数据
f9 f# q: ~4 Q8 U2 M! D7 w
选择任意多张表进行关联,表之间可以进行关联后,选择表的字段生成一张新的表,新的表数据是根据设置的关联关系生成。
( }6 q( _9 w4 J, u/ c
1. 选择表做关联关系
2 Y# A+ Q3 c1 a* U1 D; x; K/ O9 s% W

* K$ y: D7 _0 w+ g5 ^/ W' T 2. 设置关联关系类型及关联字段
7 w+ R* ~+ T1 |, T7 a

! J, b# \% S1 K& F6 A9 \" I/ X! j 3. 选择最终生成关联新表数据需要的字段
$ f! ~8 B4 @# a6 h- f

3 D# G! i! `' r1 K
4. 主题表数据追加覆盖
4 s5 H8 I' {# p R
可以对主题表的数据进行追加或覆盖操作,此处是选择文件数据源中的文件数据,解析文件,通过设置字段对应关系,将文件中的数据追加或覆盖到主题表中。
# @) b% B& K* ~8 k! y7 o" P
1.操作入口,主题表列表中,主题表后面更多操作中的“追加覆盖数据”按钮:
7 h$ H+ N) U& q- W% T7 J

' u( \4 d. w' P$ H
2. 选择文件数据源中的文件,点击追加或覆盖
% @# U$ M( B/ s2 z2 C6 F

3 m( |1 n. ?6 a( D2 a; y" l 3. 当选择的文件是EXCEL时,可以选择EXCEL文件中用户需要的工作簿,以及设置工作簿数据中的字段起始行及数据起始行
8 v, g6 P0 U' h4 j0 s3 k6 t' l

+ [1 n" P0 e" R 4. 进入数据预处理,可进行数据简单的处理后再将数据追加或覆盖到主题表中
% h0 p8 s Z1 c4 O

' b7 g( F y; W3 d; M6 ?8 G" D4 E9 @$ g
5. 点击追加或覆盖,设置字段对应关系,可点击按位置匹配或按名称匹配
# Y& k3 Z& E. m/ J

# {% F) b* f9 A! [ 也可针对某一个字段自行选择设置字段对应关系
9 k( P7 h" O8 P8 {. i& V! G, c- P

v% c+ L& l# \1 E+ U a+ T
设置完字段对应关系后,点击确定,即可将进行预处理的文件数据追加或覆盖到主题表中
3 r9 W" ]/ L5 ]6 Z# {6 O8 c