function di pandas python

20+ Function di Pandas Python Yang Perlu diketahui Pemula

Posted by

Python telah menyediakan built-in function yang dapat langsung kita gunakan di Pandas yang berguna untuk analisis data yang jumlahnya cukup banyak, mungkin ratusan. Ada beberapa function yang sering digunakan dan pastinya perlu diketahui oleh para pemula. Berikut 20+ function dasar di Pandas Python.

Sebelumnya mari kita buat dataframe terlebih dahulu seperti di bawah ini.

import pandas as pd
import numpy as np
import random

data = {'Mata Kuliah': ['Algoritma', 'Kalkulus', 'Metode Kuantitatif', 'Data Mining', 'Pemrograman']*2,
        'Tipe Ujian': ['UTS']*5 + ['UAS']*5,
        'Jumlah Mahasiswa': [30, 34, 28, 29, 32, 30, 31, 27, np.nan, 28],
        'Nilai Rata-rata Kelas': [random.choice(range(60, 85)) for i in range(10)]}

df = pd.DataFrame(data)
df

Output:

contoh dataframe

head()

head() digunakan untuk menampilkan data awal atau data teratas pada dataframe. Default-nya jika kita tidak memberikan argumen di dalam tanda kurung (), data yang akan ditampilkan adalah 5 baris teratas. Namun, kita juga dapat menentukan berapa baris data yang ingin ditampilkan dengan memberikan argumen berupa bilangan integer.

contoh penggunaan head()

tail()

tail() digunakan untuk menampilkan data terbawah pada dataframe. Sama halnya dengan head(), nilai default tail() adalah 5.

contoh penggunaan tail()

Baca juga: Membuat Dataframe dari List dengan zip() Function di Python

sample()

sample() digunakan untuk menampilkan contoh data secara acak. Default-nya adalah 1, namun kita dapat memberikan bilangan integer sebagai argumen jika menginginkan sampel data lebih dari 1.

contoh penggunaan sample()

info()

info() digunakan untuk menampilkan informasi detail tentang dataframe, seperti jumlah baris data, nama-nama kolom berserta jumlah data dan tipe datanya, dan sebagainya.

contoh penggunaan info()

describe()

describe() digunakan untuk menampilkan deskriptif statistik data. Hanya kolom yang bertipe numerik yang akan ditampilkan statistiknya.

contoh penggunaan describe()

set_index()

set_index() digunakan untuk mengatur indeks dari dataframe. Kita dapat menjadikan kolom sebagai indeks ataupun menentukan indeks baru dengan set_index().

contoh penggunaan set_index()

reset_index()

reset_index() digunakan untuk me-reset indeks yang telah ter-set dan menjadikan indeksnya default, yaitu berupa bilangan integer yang dimulai dari 0.

contoh penggunaan reset_index()

count()

count() digunakan untuk menghitung jumlah baris data yang tidak bernilai NaN pada dataframe.

contoh penggunaan count()

sum()

sum() digunakan untuk menjumlahkan bilangan numerik pada dataframe berdasarkan kolom.

contoh penggunaan sum()

mean()

mean() digunakan untuk menghitung nilai rata-rata dari sebuah kolom numerik di dataframe.

contoh penggunaan mean()

unique()

unique() digunakan untuk menampilkan nilai unik dari suatu kolom.

contoh penggunaan unique()

isna()

isna() digunakan untuk mengecek apakah ada nilai NaN pada dataframe. Function ini akan mengembalikan nilai Boolean, True atau False, untuk tiap elemen di dataframe. Kita juga dapat menambahkan function any() untuk mengecek nilai NaN berdasarkan kolom.

contoh penggunaan isna()

replace()

replace() digunakan untuk mengganti sebuah nilai pada dataframe. Misalnya disini kita mengganti nilai NaN yang ada di dataframe dengan 30.

modul data science ilmudatapy
contoh penggunaan replace()

astype()

astype() digunakan untuk mengubah tipe data dari sebuah kolom di dataframe. Misalnya disini kita mengubah tipe data kolom ‘Jumlah Mahasiswa’ dari yang tadinya ‘float’ menjadi ‘int’.

contoh penggunaan astype()

isin()

isin() digunakan untuk mengecek apakah ada elemen tertentu di dalam dataframe. Function ini mengembalikan nilai Boolean, True atau False, untuk tiap elemen pada dataframe. Kita juga dapat menambahkan function any() untuk mengecek keberadaan suatu elemen pada kolom tertentu.

contoh penggunaan isin()

dtypes

dtypes digunakan untuk mengecek tipe data untuk tiap kolom di dataframe. Bisa juga digunakan untuk mengecek tipe data salah satu kolom.

contoh penggunaan dtypes

size

size digunakan untuk mengetahui jumlah seluruh elemen yang ada di dataframe.

contoh penggunaan size()

shape

shape digunakan untuk mengetahui dimensi dari dataframe atau ukuran baris dan kolomnya.

contoh penggunaan shape

columns

columns digunakan untuk menampilkan nama-nama kolom pada dataframe.

contoh penggunaan columns

loc

loc digunakan untuk mengakses data berdasarkan label (nama kolom).

contoh penggunaan loc

iloc

iloc digunakan untuk mengakses data berdasarkan posisi .
contoh penggunaan iloc

Semoga bermanfaat!

Other Posts
modul data science ilmudatapy