library python untuk data science

Pengenalan Library Python untuk Data Science

Posted by

Agar dapat menganalisis data di Python, kita harus mengetahui terlebih dahulu tentang packages apa saja yang ada di Python yang relevan digunakan untuk analisis data.

Python library merupakan sebuah kumpulan function dan method yang memudahkan kita dalam melakukan analisis data. Library biasanya mengandung built-in module yang menyediakan fungsi-fungsi yang berbeda yang dapat langsung kita gunakan.

Pandas

Pandas adalah sebuah library Python untuk manipulasi dan analisis data. Pandas merupakan tool yang paling penting yang harus dikuasai jika kita ingin menggeluti data science.

Pandas menyediakan dua tipe struktur data yaitu Series dan Dataframe.

Series merupakan objek satu dimensi, sedangkan dataframe merupakan objek dua dimensi. Kedua jenis objek tersebut dapat menyimpan berbagai jenis tipe data seperti string, integer, dan float.

Baca juga: Cara Import dan Export Data di Python

Numpy

Numpy adalah library Python yang digunakan untuk melakukan operasi array. Numpy merupakan singkatan dari Numerical Python.

Numpy menyediakan banyak method yang sangat berguna untuk scientific computing seperti linear algebra, matriks, dan sebagainya.

SciPy

Masih seputar library yang digunakan untuk scientific computing, Scipy adalah library yang berguna untuk menyelesaikan problem matematika seperti integral, persamaan diferensial, optimisasi, dan sebagainya.

Scipy juga dapat digunakan untuk image processing.

Baca juga: Cara Menangani Missing Values di Project Data Science

Matplotlib

Beranjak ke visualisasi data, salah satu library yang banyak digunakan adalah Matplotlib. Library ini dapat membantu kita dengan mudah membuat plot atau grafik untuk menampilkan hasil analisis dalam bentuk visual.

Grafik atau plot yang kita buat juga dapat dengan mudah di-custom sesuai keinginan.

Seaborn

Selain Matplotlib, Seaborn juga merupakan salah satu library untuk visualisasi data yang termasuk high level. Dengan Seaborn kita dapat membuat plot seperti heat maps, time series, dan violin plots dengan mudah.

Baca juga: Cara Mengecek Tipe dan Distribusi Data di Pandas Python

Scikit-Learn

Kita memerlukan algoritma machine learning untuk dapat membangun sebuah model menggunakan dataset dan menghasilkan prediksi. Library Scikit-Learn merupakan salah satu algorithmic libraries yang dapat memudahkan kita memodelkan data.

Scikit-Learn menyediakan berbagai function yang dapat menyelesaikan task machine learning dari dasar hingga kompleks. Library Scikit-Learn memiliki berbagai tools untuk pemodelan statistik seperti regresi, klasifikasi, clustering, dan sebagainya.

Semoga bermanfaat..

Other Posts