function di pandas python

20+ Function di Pandas Python Yang Perlu diketahui Pemula

Posted by

Python telah menyediakan built-in function yang dapat langsung kita gunakan di Pandas yang berguna untuk analisis data yang jumlahnya cukup banyak, mungkin ratusan. Ada beberapa function yang sering digunakan dan pastinya perlu diketahui oleh para pemula. Berikut 20+ function dasar di Pandas Python.

Sebelumnya mari kita buat dataframe terlebih dahulu seperti di bawah ini.

import pandas as pd
import numpy as np
import random

data = {'Mata Kuliah': ['Algoritma', 'Kalkulus', 'Metode Kuantitatif', 'Data Mining', 'Pemrograman']*2,
        'Tipe Ujian': ['UTS']*5 + ['UAS']*5,
        'Jumlah Mahasiswa': [30, 34, 28, 29, 32, 30, 31, 27, np.nan, 28],
        'Nilai Rata-rata Kelas': [random.choice(range(60, 85)) for i in range(10)]}

df = pd.DataFrame(data)
df

Output:

head()

head() digunakan untuk menampilkan data awal atau data teratas pada dataframe. Default-nya jika kita tidak memberikan argumen di dalam tanda kurung (), data yang akan ditampilkan adalah 5 baris teratas. Namun, kita juga dapat menentukan berapa baris data yang ingin ditampilkan dengan memberikan argumen berupa bilangan integer.

tail()

tail() digunakan untuk menampilkan data terbawah pada dataframe. Sama halnya dengan head(), nilai default tail() adalah 5.

sample()

sample() digunakan untuk menampilkan contoh data secara acak. Default-nya adalah 1, namun kita dapat memberikan bilangan integer sebagai argumen jika menginginkan sampel data lebih dari 1.

info()

info() digunakan untuk menampilkan informasi detail tentang dataframe, seperti jumlah baris data, nama-nama kolom berserta jumlah data dan tipe datanya, dan sebagainya.

describe()

describe() digunakan untuk menampilkan deskriptif statistik data. Hanya kolom yang bertipe numerik yang akan ditampilkan statistiknya.

set_index()

set_index() digunakan untuk mengatur indeks dari dataframe. Kita dapat menjadikan kolom sebagai indeks ataupun menentukan indeks baru dengan set_index().

reset_index()

reset_index() digunakan untuk me-reset indeks yang telah ter-set dan menjadikan indeksnya default, yaitu berupa bilangan integer yang dimulai dari 0.

count()

count() digunakan untuk menghitung jumlah baris data yang tidak bernilai NaN pada dataframe.

sum()

sum() digunakan untuk menjumlahkan bilangan numerik pada dataframe berdasarkan kolom.

mean()

mean() digunakan untuk menghitung nilai rata-rata dari sebuah kolom numerik di dataframe.

unique()

unique() digunakan untuk menampilkan nilai unik dari suatu kolom.

isna()

isna() digunakan untuk mengecek apakah ada nilai NaN pada dataframe. Function ini akan mengembalikan nilai Boolean, True atau False, untuk tiap elemen di dataframe. Kita juga dapat menambahkan function any() untuk mengecek nilai NaN berdasarkan kolom.

replace()

replace() digunakan untuk mengganti sebuah nilai pada dataframe. Misalnya disini kita mengganti nilai NaN yang ada di dataframe dengan 30.

astype()

astype() digunakan untuk mengubah tipe data dari sebuah kolom di dataframe. Misalnya disini kita mengubah tipe data kolom ‘Jumlah Mahasiswa’ dari yang tadinya ‘float’ menjadi ‘int’.

isin()

isin() digunakan untuk mengecek apakah ada elemen tertentu di dalam dataframe. Function ini mengembalikan nilai Boolean, True atau False, untuk tiap elemen pada dataframe. Kita juga dapat menambahkan function any() untuk mengecek keberadaan suatu elemen pada kolom tertentu.

dtypes

dtypes digunakan untuk mengecek tipe data untuk tiap kolom di dataframe. Bisa juga digunakan untuk mengecek tipe data salah satu kolom.

size

size digunakan untuk mengetahui jumlah seluruh elemen yang ada di dataframe.

shape

shape digunakan untuk mengetahui dimensi dari dataframe atau ukuran baris dan kolomnya.

columns

columns digunakan untuk menampilkan nama-nama kolom pada dataframe.

loc

loc digunakan untuk mengakses data berdasarkan label (nama kolom).

iloc

iloc digunakan untuk mengakses data berdasarkan posisi .

Semoga bermanfaat!