筋肉で解決しないために。

日々出会うモノに対する考察をしたり、主に以下のテーマに関して書いています。 データサイエンス/人工知能/AI/機械学習/DeepLearning/Python//数学/統計学/統計処理

pandas入門5_「データの並び替え」

こんにちは、ワタルです。

さっと見て、「あぁそうだったそうだった」と確認できるハンドブックのような存在を目指して。

pandas入門第5回目、「データの並び替え」です。

今回の学習内容

今回は、Seriesの要素をindexの順や、要素小さい順に並び替えたり、その順位を見る方法について学んでいきます。

今回学ぶ関数

今回は、以下の関数について学びます。

ser.sort_index()(indexで並び替える)
ser.order()(値で並び替える)
ser.rank()(何番目に小さいかを表す)
ser.unique()(重複する要素をまとめる)
ser1.value_counts()(重複するデータの数を数える)

おまじない

import numpy as np
from pandas import Series,DataFrame
import pandas as pd
from numpy.random import randn

ser.sort_index()(indexで並び替える)

#まずはseriesをつくります
ser = Series(range(3),index=['C','A','B']) 
ser

>>>
C    0
A    1
B    2
dtype: int64
#indexで並び替えます
ser1.sort_index()

#A,B,Cの順になったことがわかります
>>>
A    1
B    2
C    0
dtype: int64

ser.order()(値で並び替える)

ser.order()

>>>
C    0
A    1
B    2
dtype: int64

ser.rank()(何番目に小さいかを表す)

#ランダムな要素を持ったseriesをつくります
ser2 = Series(randn(10))
ser2

>>>
0   -1.188607
1   -0.821823
2   -1.003925
3    1.316921
4   -1.273743
5   -1.005138
6   -0.977085
7   -0.328831
8   -0.558445
9    1.552390
dtype: float64
#何番目に小さいかの順位をみてみます

ser2.rank()

>>>
0     2.0
1     6.0
2     4.0
3     9.0
4     1.0
5     3.0
6     5.0
7     8.0
8     7.0
9    10.0
dtype: float64

ser.unique()(重複する要素をまとめる)

#新たにseriesをつくります

ser3 = Series(['w','w','x', 'y', 'z' ,'w' ,'w' ,'x' ,'x' ,'y' ,'a' ,'z' ])
ser3

>>>
0     w
1     w
2     x
3     y
4     z
5     w
6     w
7     x
8     x
9     y
10    a
11    z
dtype: object
#重複するデータをまとめます。

ser3.unique()

>>>
array(['w', 'x', 'y', 'z', 'a'], dtype=object)

ser1.value_counts()(重複するデータの数を数える)

ser3.value_counts()

#重複するデータの数がわかります

>>>
w    4
x    3
z    2
y    2
a    1
dtype: int64

今回は、Seriesの要素をindexの順や、要素小さい順に並び替えたり、その順位を見る方法について学びました。

お疲れ様でした!

次回は、こちら。

watarumon.hatenablog.com

それじゃー、また。