[数据处理] 从nc文件中提取风速数据并且进行时间序列分析

[复制链接]
                                   本文目的
  • 介绍了如何从nc文件中,提取风速数据;
  • 介绍如何将风速数据转换成时间序列;
  • 简单的时间序列的趋势拆解(首发)。
    6 V% e' a  S' g$ ~" E

    $ |' Z9 D8 }% v& x
代码链接

代码我已经放在Github上面了,免费分享使用,https://github.com/yuanzhoulvpi2 ... ree/main/python_GIS


% I" t5 s  z6 }

过程介绍
* J' i# F& r. D# [

( ]4 v' S+ l/ K" }
9 U# g9 _; O' `. E& V( ^
1. 导入包
7 f# d9 z# v  F# G. p- M& l3 K
. b  c& b/ {# ^- j, ?' }
[Python] 纯文本查看 复制代码
# 基础的数据处理工具
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt # 可视化
import datetime # 处理python时间函数
import netCDF4 as nc  # 处理nc数据
from netCDF4 import num2date  # 处理nc数据
import geopandas as gpd  # 处理网格数据,shp之类的
import rasterio  # 处理tiff文件
from shapely.geometry import Point  # gis的一些逻辑判断
from cartopy import crs as ccrs  # 设置投影坐标系等
from tqdm import tqdm  # 打印进度条
from joblib import Parallel, delayed  # 并行
import platform  # 检测系统

tqdm.pandas()

# matplotlib 显示中文的问题
if platform.system() == 'Darwin':
    plt.rcParams["font.family"] = 'Arial Unicode MS'
elif platform.system() == 'Windows':
    plt.rcParams["font.family"] = 'SimHei'
else:
    pass
* H1 Y. o3 e$ o6 i) c+ C  B8 t

& _& s+ D+ {: \

. p. p+ o6 D, D9 u6 K  X2.导入数据 处理数据
( T, d/ d/ Y) H9 h" z' w* Y# [, k: U. A8 D4 I. \/ d
4 N8 }5 w6 I# i+ _3 ]
[Python] 纯文本查看 复制代码
# 导入数据
nc_data = nc.Dataset("./数据集/GIS实践3/2016_2020.nc")

# 处理数据
raw_latitude = np.array(nc_data.variables['latitude'])
raw_longitude = np.array(nc_data.variables['longitude'])
raw_time = np.array(nc_data.variables['time'])
raw_u10 = np.array(nc_data.variables['u10'])
raw_v10 = np.array(nc_data.variables['v10'])
# 提取缺失值,并且将缺失值替换
missing_u10_value = nc_data.variables['u10'].missing_value
missing_v10_value = nc_data.variables['v10'].missing_value
raw_v10[raw_v10 == missing_v10_value] = np.nan
raw_u10[raw_u10 == missing_u10_value] = np.nan


# 处理时间
def cftime2datetime(cftime, units, format='%Y-%m-%d %H:%M:%S'):
    """
    将nc文件里面的时间格式 从cftime 转换到 datetime格式
    :param cftime:
    :param units:
    :param format:
    :return:
    """
    return datetime.datetime.strptime(num2date(times=cftime, units=units).strftime(format), format)

clean_time_data = pd.Series([cftime2datetime(i, units=str(nc_data.variables['time'].units)) for i in tqdm(raw_time)])
clean_time_data[:4]

& X3 S6 B: Q  b
  P6 L4 C+ l3 e# `" T( p" e% J3. 计算风速数据& c  A/ w9 f7 o! f
7 y% Q: D' _  {
" r, {% f" d. w' U
[Python] 纯文本查看 复制代码
windspeed_mean = pd.Series([np.sqrt(raw_v10[i,:, :] ** 2 + raw_u10[i, :, :]**2).mean() for i in tqdm(range(clean_time_data.shape[0]))])

time_windspeed = pd.DataFrame({'time':clean_time_data,'mean_ws':windspeed_mean})
time_windspeed
2 C$ B/ p6 V2 w# [
6b7fd110a68e6d3fd40460ccdd7a810b.png

/ m; M' |( Y( t( a& o- L2 w, b% o6 y' k2 x# y6 P/ o

4 @( |& a0 Q  _; y4. 年度数据可视化
2 y8 M$ o' I: ~; H% J3 I0 p& C2 V' F& O9 \& B
) h7 i7 U7 D9 p  a
[Python] 纯文本查看 复制代码
year_data = time_windspeed.groupby(time_windspeed.time.dt.year).agg(
    mean_ws = ('mean_ws', 'mean')
).reset_index()

# year_data

with plt.style.context('fivethirtyeight') as style:

    fig, ax = plt.subplots(figsize=(10,3), dpi=300)
    ax.plot(year_data['time'], year_data['mean_ws'], '-o',linewidth=3, ms=6)
    ax.set_xticks(year_data['time'])
    #
    #
    for i in range(year_data.shape[0]):
        ax.text(year_data.iloc[/size][/font][i][font=新宋体][size=3]['time']+0.1, year_data.iloc[/size][/font][i][font=新宋体][size=3]['mean_ws'], str(np.around(year_data.iloc[/size][/font][i][font=新宋体][size=3]['mean_ws'], 2)),
                bbox=dict(boxstyle='round', facecolor='white', alpha=0.5))
    #
    for i in ['top', 'right']:
        ax.spines[/size][/font][i][font=新宋体][size=3].set_visible(False)

    ax.set_title("各年平均风速")
    ax.set_ylabel("$Wind Speed / m.s^{-1}$")
* V+ p/ s4 q* ?+ w) {
952d93a401a01cd1fa10be892b8b64d6.png

, ]/ F7 ^! l% D" ^1 n3 V% F# y: j+ n6 l3 {, J

$ o6 Z7 F, B- t0 s& G# v5. 月维度数据可视化& T' E6 z4 O) I$ H
[Python] 纯文本查看 复制代码
month_data = time_windspeed.groupby(time_windspeed.time.dt.month).agg(
    mean_ws = ('mean_ws', 'mean')
).reset_index()


with plt.style.context('fivethirtyeight') as style:

    fig, ax = plt.subplots(figsize=(10,3), dpi=300)
    ax.plot(month_data['time'], month_data['mean_ws'], '-o',linewidth=3, ms=6)
    ax.set_xticks(month_data['time'])
    _ = ax.set_xticklabels(labels=[f'{i}月' for i in month_data['time']])


    for i in range(month_data.shape[0]):
        ax.text(month_data.iloc[/size][/font][i][font=新宋体][size=3]['time'], month_data.iloc[/size][/font][i][font=新宋体][size=3]['mean_ws']+0.05, str(np.around(month_data.iloc[/size][/font][i][font=新宋体][size=3]['mean_ws'], 2)),
                bbox=dict(boxstyle='round', facecolor='white', alpha=0.5))

    for i in ['top', 'right']:
        ax.spines[/size][/font][i][font=新宋体][size=3].set_visible(False)

    ax.set_title("各月平均风速")
    ax.set_ylabel("$Wind Speed / m.s^{-1}$")
    fig.savefig("month_plot.png")

( f1 R8 o0 L2 D
a520cff3361647efbb668c89005a5570.png
! Y5 C) M; a: P! y" @
$ P' d0 K. V" O( k

0 b4 \9 S0 v$ b* [6 O' j6.天维度数据可视化7 L. t9 f+ y* i+ Z! d. b+ T
  • 计算天数据
    % ?+ C5 a2 ]7 u  I

    ' k4 T" x1 G8 r
[Python] 纯文本查看 复制代码
day_data = time_windspeed.groupby(time_windspeed.time.apply(lambda x: x.strftime('%Y-%m-%d'))).agg(
    mean_ws = ('mean_ws', 'mean')
).reset_index()

day_data['time'] = pd.to_datetime(day_data['time'])

day_data = day_data.set_index('time')
day_data.head()
  • 可视化
    * u. S" b0 q5 M6 l% i1 Z
    2 s  ~* u2 y. J- H
[Python] 纯文本查看 复制代码
# day_data.dtypes
fig, ax = plt.subplots(figsize=(20,4), dpi=300)
ax.plot(day_data.index, day_data['mean_ws'], '-o')
# ax.xaxis.set_ticks_position('none')
# ax.tick_params(axis="x", labelbottom=False)
ax.set_title("每天平均风速")
ax.set_ylabel("$Wind Speed / m.s^{-1}$")
ax.set_xlabel("date")
fig.savefig('day_plot.png')
3 A) E8 N) w) d' X( B* r# a1 G" j
7 a0 V- u" _9 {

% }6 d8 D  l  x5 `# g7 N$ k
053571827f212c867e38f40c8aa49ca5.png

' f' l( I5 N/ ~' S' h* u4 k1.天维度数据做趋势拆解* p9 Z7 w& E5 e  J5 b: m
5 ?* z- V8 i' q
[Python] 纯文本查看 复制代码
# 导入包
from statsmodels.tsa.seasonal import seasonal_decompose
from dateutil.parser import parse
# 乘法模型
result_mul = seasonal_decompose(day_data['mean_ws'], model="multilicative", extrapolate_trend='freq')
result_add = seasonal_decompose(day_data['mean_ws'], model="additive", extrapolate_trend='freq')
font = {'family': 'serif',
        'color': 'darkred',
        'weight': 'normal',
        'size': 16,
        }
# 画图

with plt.style.context('classic'):
    fig, ax = plt.subplots(ncols=2, nrows=4, figsize=(22, 15), sharex=True, dpi=300)


    def plot_decompose(result, ax, index, title, fontdict=font):
        ax[0, index].set_title(title, fontdict=fontdict)
        result.observed.plot(ax=ax[0, index])
        ax[0, index].set_ylabel("Observed")

        result.trend.plot(ax=ax[1, index])
        ax[1, index].set_ylabel("Trend")

        result.seasonal.plot(ax=ax[2, index])
        ax[2, index].set_ylabel("Seasonal")

        result.resid.plot(ax=ax[3, index])
        ax[3, index].set_ylabel("Resid")


    plot_decompose(result=result_add, ax=ax, index=0, title="Additive Decompose", fontdict=font)
    plot_decompose(result=result_mul, ax=ax, index=1, title="Multiplicative Decompose", fontdict=font)
    fig.savefig('decompose.png')

* W; _  v0 y: A# l' z" X" L4 Z
cd8468c3910ecbcfac542ed3328df432.jpeg                   a9 [2 m- E5 m3 }$ U0 d7 \$ f
9 d! {) ?2 v" R* p( ]. y
3 B  }% i* x( ]5 ^6 h& s& T6 N

0 W# `6 T. ]2 U9 S9 @2 E# t
5 x; L4 |" K4 c. T7 i* A, L; ^( R; x
回复

举报 使用道具

相关帖子

全部回帖
暂无回帖,快来参与回复吧
懒得打字?点击右侧快捷回复 【吾爱海洋论坛发文有奖】
您需要登录后才可以回帖 登录 | 立即注册
尖叫的土豆
活跃在6 天前
快速回复 返回顶部 返回列表