pandas入門5_「データの並び替え」
こんにちは、ワタルです。
さっと見て、「あぁそうだったそうだった」と確認できるハンドブックのような存在を目指して。
pandas入門第5回目、「データの並び替え」です。
- 今回の学習内容
- 今回学ぶ関数
- おまじない
- ser.sort_index()(indexで並び替える)
- ser.order()(値で並び替える)
- ser.rank()(何番目に小さいかを表す)
- ser.unique()(重複する要素をまとめる)
- ser1.value_counts()(重複するデータの数を数える)
今回の学習内容
今回は、Seriesの要素をindexの順や、要素小さい順に並び替えたり、その順位を見る方法について学んでいきます。
今回学ぶ関数
今回は、以下の関数について学びます。
ser.sort_index()(indexで並び替える) ser.order()(値で並び替える) ser.rank()(何番目に小さいかを表す) ser.unique()(重複する要素をまとめる) ser1.value_counts()(重複するデータの数を数える)
おまじない
import numpy as np from pandas import Series,DataFrame import pandas as pd from numpy.random import randn
ser.sort_index()(indexで並び替える)
#まずはseriesをつくります ser = Series(range(3),index=['C','A','B']) ser >>> C 0 A 1 B 2 dtype: int64
#indexで並び替えます ser1.sort_index() #A,B,Cの順になったことがわかります >>> A 1 B 2 C 0 dtype: int64
ser.order()(値で並び替える)
ser.order() >>> C 0 A 1 B 2 dtype: int64
ser.rank()(何番目に小さいかを表す)
#ランダムな要素を持ったseriesをつくります ser2 = Series(randn(10)) ser2 >>> 0 -1.188607 1 -0.821823 2 -1.003925 3 1.316921 4 -1.273743 5 -1.005138 6 -0.977085 7 -0.328831 8 -0.558445 9 1.552390 dtype: float64
#何番目に小さいかの順位をみてみます ser2.rank() >>> 0 2.0 1 6.0 2 4.0 3 9.0 4 1.0 5 3.0 6 5.0 7 8.0 8 7.0 9 10.0 dtype: float64
ser.unique()(重複する要素をまとめる)
#新たにseriesをつくります ser3 = Series(['w','w','x', 'y', 'z' ,'w' ,'w' ,'x' ,'x' ,'y' ,'a' ,'z' ]) ser3 >>> 0 w 1 w 2 x 3 y 4 z 5 w 6 w 7 x 8 x 9 y 10 a 11 z dtype: object
#重複するデータをまとめます。 ser3.unique() >>> array(['w', 'x', 'y', 'z', 'a'], dtype=object)
ser1.value_counts()(重複するデータの数を数える)
ser3.value_counts() #重複するデータの数がわかります >>> w 4 x 3 z 2 y 2 a 1 dtype: int64
今回は、Seriesの要素をindexの順や、要素小さい順に並び替えたり、その順位を見る方法について学びました。
お疲れ様でした!
次回は、こちら。
それじゃー、また。