Dalam menganalisis data, terkadang kita perlu mengambil nama kolom di dataframe untuk melakukan operasi tertentu.
Jika data sedang kita analisis hanya memiliki sedikit kolom, tentunya kita akan dengan mudah mengetahui nama-nama kolom tersebut. Namun, jika dataframe tersebut memiliki puluhan bahkan mungkin ratusan kolom, itu akan cukup merepotkan, bukan?
Nah, pada tutorial kali ini, kita akan membahas bagaimana cara mengambil nama kolom di dataframe dengan Pandas Python.
Mari kita load dataset-nya terlebih dahulu ke dataframe Pandas menggunakan read_csv()
.
import pandas as pd
df = pd.read_csv("dataset/california_housing_prices.csv")
df.head()
Output:
Ada beberapa cara yang dapat kita lakukan untuk mengambil nama kolom di dataframe.
Baca juga: Membuat Dataframe dari List dengan zip() Function di Python
Menggunakan .columns
Cara yang pertama yaitu dengan menggunakan .columns
. Ini merupakan cara yang banyak digunakan untuk mendapatkan nama kolom. Cara penggunaannya cukup mudah. Perhatikan contoh berikut.
df.columns
Output:
Kita juga dapat menambahkan .values
untuk mengambilnya sebagai array seperti di bawah ini.
df.columns.values
Output:
Menggunakan keys()
Selain menggunakan .columns
, kita juga dapat menggunakan keys()
untuk mengambil nama kolom. Perhatikan contoh berikut.
df.keys()
Output:
Mengambil nama kolom dengan iterasi
Kita juga dapat mengambil nama kolom dengan iterasi. Pada contoh ini kita menggunakan perulangan for
.
for col in df.columns:
print(col)
Output:
Mengambil nama kolom sebagai list
Ada dua cara untuk mengambil nama kolom dan memasukkannya ke dalam list yaitu menggunakan method list()
dan tolist()
. Perhatikan cara penggunaannya sebagai berikut.
Pertama kita akan menggunakan list()
.
print(list(df.columns))
Output:
tolist()
. print(df.columns.values.tolist())
Output:
Dapat kita lihat, dua cara di atas menghasilkan output yang sama.
Baca juga: Menjadikan Kolom Sebagai Indeks Pada Dataframe Pandas
Mengambil nama kolom berdasarkan indeks tertentu
Selain mengambil keseluruhan nama kolom di dataframe seperti contoh-contoh di atas, kita juga dapat mengambil nama kolom tertentu di dataframe. Kita hanya perlu menuliskan nomor indeks kolom tersebut di dalam kurung siku dan ditempatkan setelah .columns
. Perhatikan beberapa contoh berikut.
Pada contoh di atas, kita mengambil nama kolom dengan indeks 2 atau kolom ke tiga, kolom dengan indeks 5 atau kolom ke enam, dan kolom paling akhir yang dapat kita tulis dengan indeks -1.
Itulah beberapa cara yang dapat Anda lakukan untuk mengambil nama kolom di dataframe.
Semoga bermanfaat..
Jika Anda yang sedang belajar data science atau mengolah data dengan bahasa pemrograman Python namun masih suka bingung menulis kode Python-nya, kami telah menyusun Paket E-modul Data Science dengan Python yang didesain khusus untuk pemula dengan penjelasan bahasa Indonesia yang lengkap untuk setiap blok kode-nya. Dapatkan sekarang juga dengan klik di sini!