Dalam analisis data adakalanya kita ingin menjadikan kolom sebagai indeks untuk mempermudah proses analisis. Menjadikan salah satu kolom maupun beberapa
Continue Reading
Dalam analisis data adakalanya kita ingin menjadikan kolom sebagai indeks untuk mempermudah proses analisis. Menjadikan salah satu kolom maupun beberapa
Continue ReadingScatter plot adalah salah satu jenis visualisasi data yang digunakan untuk melihat hubungan antara dua variabel numerik yang diproyeksikan pada
Continue ReadingDi dalam mengerjakan projek data science atau data analisis terkadang data yang ada tidak memiliki header atau nama kolom yang
Continue ReadingSalah satu bagian penting dalam data science adalah visualisasi data atau data visualization. Saat kita melakukan analisis untuk menemukan insight
Continue ReadingEncoding adalah salah satu tahap praproses data sebelum diproses dengan algoritma machine learning. Dalam mengerjakan projek data science ataupun machine
Continue ReadingTrain/test split adalah salah satu metode yang dapat digunakan untuk mengevaluasi performa model machine learning. Metode evaluasi model ini membagi
Continue ReadingSaat kita sedang menangani data numerik yang bersifat kontinu, masalah yang sering dihadapi adalah dalam mengamati sebaran nilainya atau distribusi
Continue ReadingMemilih algoritma machine learning yang tepat untuk proyek data science yang sedang kita kerjakan merupakan bagian penting karena akan mempengaruhi
Continue ReadingNormalisasi data merupakan salah satu teknik yang penting untuk dipahami dalam praproses data. Dalam analisis dan eksplorasi data sering kali
Continue ReadingData formatting adalah salah satu proses yang cukup penting dalam menganalisis data. Data formatting merupakan proses membentuk data menjadi bentuk
Continue Reading