pandasは、日付処理も充実しています。
すぐに使える関数をまとめました。
準備
import pandas as pd
日付に変換
Stringから作成する場合。
> pd.to_datetime('2016-08-26 00:00:00')
Timestamp('2016-08-26 00:00:00')
to_datetimeは、かなり賢く以下のような入力がデフォルトで正しくパースされます。
> pd.to_datetime('2016/8/26 0:0')
> pd.to_datetime('2016/8/26')
> pd.to_datetime('20160826')
> pd.to_datetime('160826 0000')
Timestamp('2016-08-26 00:00:00')
ただし、日付6桁は欧米式にパースされます。
> pd.to_datetime('260816 0100')
Timestamp('2016-08-26 01:00:00')
Python pandas で日時関連のデータ操作をカンタンに
日ごと、月ごと、年ごとに処理
年月日を取り出します。
> pd.to_datetime('2016-08-26 0:0:0').year
2016
> pd.to_datetime('2016-08-26 0:0:0').month
8
> pd.to_datetime('2016-08-26 0:0:0').day
26
dt
を使うとdatetime64
型の要素のプロパティに直接アクセスできます。
> df['date1']
0 2016-08-26
1 2016-08-27
Name: date1, dtype: datetime64[ns]
> df['date1'].dt.month
8
groupby
する場合です。
# 各カラムを月別に合計
df.groupby(df['date1'].dt.month).sum()
# グルーピングしたデータを取得
df.groupby(df['date1'].dt.month).groups
0 件のコメント:
コメントを投稿