時間でデータを整理する方法
時系列データをプロットする。
時系列データをプロットするには、インデックスを時系列データにする必要がある。
df = df.set_index('timestamp')
df.plot()
これで時系列折れ線グラフが表示される。
時系列のヒストグラムを作る
import numpy as np
df = pd.DataFrame(df["timestamp"])
df['value'] = 1
df = df.set_index('timestamp')
# daily
df1 = df.resample('D').sum()
df1.plot()
df1.max()
resample
に渡す文字列は、Offset Aliases に従う。
私は下のものをよく使う。
文字列 | 説明 |
---|---|
S | 秒 |
T | 分 |
H | 時 |
D | 日 |
W | 週 |
M | 月 |