pandas入門6_「Dataframeの操作と統計量」
こんにちは、ワタルです。
さっと見て、「あぁそうだったそうだった」と確認できるハンドブックのような存在を目指して。
pandas入門第6回目、「Dataframeの操作と統計量」です。
今回の学習内容
今回は、dataframeの合計や累積、様々な統計量の調べ方について学んでいきます。
今回学ぶ関数
今回は、以下の関数について学びます。
dataframe.sum()(行方向の合計) dataframe.sum(axis=1)(列方向の合計) dataframe.min()(行方向の最小値を求める。) dataframe.max()(行方向の最大値を求める。) dataframe.idxmin()(最小値の要素を持つindexを調べる) dataframe.idxmax()(最大値の要素を持つindexを調べる) dataframe.cumsum()(累積を求める) dataframe.describe()(DataFrameの様々な統計量をみる)
- 今回の学習内容
- 今回学ぶ関数
- おまじない
- dataframe.sum()(dataframeにおける行、列の合計)
- dataframe.min()(行方向の最小値を求める。)
- dataframe.idxmin()(最小値の要素を持つindexを調べる)
- dataframe.idxmax()(最小値の要素を持つindexを調べる)
- dataframe.cumsum()(累積を求める)
- dataframe.describe()(DataFrameの様々な統計量をみる)
- おわりに
おまじない
import numpy as np from pandas import Series,DataFrame import pandas as pd
dataframe.sum()(dataframeにおける行、列の合計)
#arrayからdataframeをつくります arr = np.array([[1,2,np.nan],[np.nan,3,4]]) dframe = DataFrame(arr,index=['A','B'],columns = ['One','Two','Three']) dframe >>> One Two Three A 1.0 2.0 NaN B NaN 3.0 4.0
dataframe.sum()(行方向の合計)
dframe.sum() #行方向の合計が計算されていることがわかります >>> One 1.0 Two 5.0 Three 4.0 dtype: float64
dataframe.sum(axis=1)(列方向の合計)
#引数に(axis=1)を指定することで、列方向が対象になります dframe.sum(axis=1) >>> A 3.0 B 7.0 dtype: float64
dataframe.min()(行方向の最小値を求める。)
dframe.min() #行の中の最小値が出力されていることがわかります #列方向に調べたいときは、引数に(axis=1)を指定します >>> One 1.0 Two 2.0 Three 4.0 dtype: float64
dataframe.idxmin()(最小値の要素を持つindexを調べる)
dframe1.idxmin()
>>>
One A
Two A
Three B
dtype: object
dataframe.idxmax()(最小値の要素を持つindexを調べる)
dframe.idxmax()
>>>
One A
Two B
Three B
dtype: object
dataframe.cumsum()(累積を求める)
dframe.cumsum() >>> One Two Three A 1.0 2.0 NaN B NaN 5.0 4.0
dataframe.describe()(DataFrameの様々な統計量をみる)
dframe.describe() #上から順に意味は以下の様になっています #count:columns方向の数 #mean:平均 #std:標準偏差 #min:最小値 #25%:第一四分位数 #50%:第二四分位数 #75%:第三四分位数 #max:最大値 >>> One Two Three count 1.0 2.000000 1.0 mean 1.0 2.500000 4.0 std NaN 0.707107 NaN min 1.0 2.000000 4.0 25% 1.0 2.250000 4.0 50% 1.0 2.500000 4.0 75% 1.0 2.750000 4.0 max 1.0 3.000000 4.0
第一四分位数についての詳細はこちらがおすすめです。 https://qiita.com/chatrate/items/e95ba42cffd6565d8fbb
おわりに
今回は、dataframeの合計や累積、様々な統計量の調べ方について学びました。
お疲れ様でした!
次回はこちら
それじゃー、また。