Perbandingan Teknik Oversampling Dalam Mengatasi Permasalahan Ketidakseimbangan Kelas Pada Kasus Penipuan Kartu Kredit

Dean, Farhan Lazuardi (9882405120111009) (2024) Perbandingan Teknik Oversampling Dalam Mengatasi Permasalahan Ketidakseimbangan Kelas Pada Kasus Penipuan Kartu Kredit. Undergraduate Thesis, Universitas Informatika dan Bisnis Indonesia.

[img] Text
Cover.pdf

Download (102kB)
[img] Text
Abstrak.pdf

Download (12kB)
[img] Text
Bab 1.pdf

Download (85kB)
[img] Text
Daftar Pustaka.pdf

Download (144kB)

Abstract

Peningkatan jumlah pengguna kartu kredit di Indonesia sejalan dengan peningkatan tingkat kejahatan di sektor perbankan, khususnya penipuan transaksi kartu kredit. Algoritma klasifikasi pada machine learning dapat diimplementasikan untuk mengklasifikasikan penipuan transaksi kartu kredit. Namun, implementasi model machine learning dalam klasifikasi penipuan transaksi kartu kredit juga menghadapi banyak tantangan, terutama terkait dengan ketidakseimbangan kelas. Untuk mengatasi masalah tersebut maka digunakan Teknik oversampling. Pada penelitian ini akan diukur kinerja teknik oversampling dalam menyeimbangkan jumlah kelas serta mengukur dan membandingkan efek setiap teknik oversampling terhadap performa model klasifikasi. Teknik oversampling yang digunakan adalah SMOTE, Borderline SMOTE, dan ADASYN. Adapun algoritma klasifikasi yang digunakan adalah Decision Tree dan Logistic Regression. Data yang digunakan dalam penelitian ini adalah card fraud detection yang didapatkan dari Kaggle.com. Data yang digunakan berjumlah 284.807 baris data, memiliki 284.315 data kelas genuine dan 492 data kelas fraud, menunjukkan ketidakseimbangan kelas yang sangat signifikan dengan rasio 575:1. Langkah yang dilakukan dalam penelitian ini adalah melakukan EDA, preprocessing data, hyperparameter tuning, pelatihan model, dan pengujian model. Hasilnya Teknik oversampling yang digunakan berhasil menyeimbangkan jumlah kelas pada dataset, tetapi cenderung mengurangi performa model terutama pada presisi dan F1 score terutama pada Logistic Regression yang mengalami penurunan signifikan. Tetapi Teknik oversampling berhasil menaikkan AUROCC pada mayoritas model dan penaikan recall yang signifikan pada model Logistic Regression. Kata kunci: penipuan, transaksi kartu kredit, ketidakseimbangan kelas, klasifikasi, oversampling

Item Type: Other
Additional Information: SKRIPSI PRODI INFORMATIKA S1
Subjects: H Social Sciences > H Social Sciences (General)
T Technology > T Technology (General)
Divisions: Fakultas Teknologi dan Informatika > Informatika
Depositing User: PERPUS PERPUSTAKAAN UNIBI
Date Deposited: 20 Nov 2024 07:54
Last Modified: 20 Nov 2024 07:54
URI: http://repository.unibi.ac.id/id/eprint/734

Actions (login required)

View Item View Item