時系列分析の場合、一つ前の値との差を比較する手法があり、差分と呼ぶ
この差分を取った後のデータを階差系列という
これによりトレンド(全体的な上昇指向や下降指向を無視する)
トレンドを取り除くことで原系列を定常過程
(時間がたっても全体で見れば、その時系列の値は変わらない性質)
にすることができる場合がある
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 |
import pandas as pd import matplotlib.pyplot as plt import statsmodels.api as sm %matplotlib inline import numpy as np # データの読み込み co2_tsdata = sm.datasets.co2.load_pandas().data # 欠損値の処理 co2_tsdata2 = co2_tsdata.fillna(method="ffill") # データの階差取得 co2_tsdata2_diff = co2_tsdata2.diff() plt.subplot(2,1,1) plt.title("Mauna Loa Weekly Atmospheric CO2 Data") plt.xlabel("date") plt.ylabel("CO2 Concentration ppmv") plt.plot(co2_tsdata2) plt.subplot(2,1,2) plt.title("Mauna Loa Weekly Atmospheric CO2 Data DIFF") plt.xlabel("date") plt.ylabel("CO2 Concentration ppmv DIFF") plt.plot(co2_tsdata2_diff) plt.subplots_adjust(wspace=0, hspace=1.0) plt.show() |