Bagaimana saya bisa mendapatkan jumlah baris dalam dataframe yang berisi nilai tertentu dalam kolom tertentu menggunakan Pandas? Sebagai contoh, saya memiliki dataframe berikut:
ClientID LastName
0 34 Johnson
1 67 Smith
2 53 Brows
Bagaimana saya bisa menemukan nomor baris yang memiliki 'Smith' di kolom 'LastName'?
Untuk mendapatkan semua indeks yang cocok dengan 'Smith'
>>> df.loc[df['LastName']=='Smith'].index
Int64Index([1], dtype='int64')
atau
>>> df.loc[df['LastName']=='Smith'].index.values
array([1])
atau jika hanya ada satu dan Anda menginginkan bilangan bulat, cukup subset
>>> df.loc[df['LastName']=='Smith'].index[0]
1
df.loc[df.LastName == 'Smith']
akan mengembalikan baris
ClientID LastName
1 67 Smith
dan
df.loc[df.LastName == 'Smith'].index
akan mengembalikan indeks
Int64Index([1], dtype='int64')
CATATAN: Nama kolom 'LastName' dan 'Last Name' atau bahkan 'lastname' adalah tiga nama unik. Praktik terbaik adalah dengan terlebih dahulu memeriksa nama yang tepat menggunakan df.columns. Jika Anda benar-benar perlu menghapus semua spasi putih pada nama kolom, Anda bisa melakukan
df.columns = [x.strip().replace(' ', '') for x in df.columns]