Kevin, Kevin (2025) OPTIMASI DETEKSI CLICK FRAUD PADA IMBALANCE DATASET DENGAN QUAD DIVISION PROTOTYPE SELECTION BASED KNN DAN XGBOOST. Skripsi thesis, Universitas Buddhi Dharma.
|
Text
COVER - BAB III.pdf - Published Version Download (2MB) |
|
|
Text
BAB IV.pdf - Published Version Restricted to Registered users only Download (2MB) |
|
|
Text
BAB V.pdf - Published Version Download (612kB) |
Abstract
Pertumbuhan pesat teknologi informasi dan ekonomi digital mendorong peningkatan penggunaan iklan digital berbasis internet, seperti model Pay-Per-Click (PPC), yang menjadi strategi pemasaran efektif bagi banyak perusahaan. Namun, di balik efektivitasnya, model ini rentan terhadap ancaman click fraud, yaitu aktivitas klik tidak sah yang dilakukan untuk tujuan merugikan pengiklan, sehingga dapat menyebabkan kerugian finansial yang signifikan. Berbagai penelitian sebelumnya telah menggunakan model machine learning sebagai pendekatan untuk mendeteksi click fraud. Namun, ketidakseimbangan data menjadi tantangan utama yang dapat menghambat kinerja optimal model tersebut. Untuk mengatasi permasalahan ini, penelitian ini bertujuan mengoptimalkan deteksi click fraud dengan menggabungkan metode Quad Division Prototype Selection Based K-Nearest Neighbor (QDPSKNN), yang mampu menangani ketidakseimbangan data secara efektif, serta model Extreme Gradient Boosting (XGBoost) sebagai klasifikasi akhir. Dataset yang digunakan adalah TalkingData AdTracking Fraud Detection Challenge, yang terdiri dari 100.000 sampel dengan 8 atribut, termasuk alamat IP, ID aplikasi, jenis perangkat, sistem operasi, saluran distribusi iklan, serta label yang menunjukkan apakah klik tersebut valid atau merupakan palsu. Metode penelitian ini melibatkan preprocessing data, teknik balancing data, hyperparameter tuning menggunakan Random Search, serta evaluasi model dengan metrik accuracy, precision, recall, dan F1-score. Hasil penelitian menunjukkan bahwa kombinasi QDPSKNN dengan model XGBoost memberikan performa terbaik dengan accuracy sebesar 96,77%, recall 99,30%, precision 96,91%, dan F1-score 98,09%, mengungguli metode lainnya dalam mendeteksi click fraud. Manfaat dari penelitian ini adalah menyediakan pendekatan yang mampu meningkatkan akurasi deteksi klik tidak sah pada data yang tidak seimbang, dengan memanfaatkan teknik seleksi instance yang informatif untuk memperkuat keandalan sistem deteksi untuk platform periklanan digital.
| Item Type: | Thesis (Skripsi) |
|---|---|
| Uncontrolled Keywords: | Data Balancing, Machine Learning, Pay-Per-Click, Random Search, TalkingData |
| Subjects: | 000 Karya Umum > 005 Pemograman > 005.73 Struktur Data 600 Teknologi dan Ilmu Terapan (Bisnis) > 650.0285 Pengolahan dan Analisa Data di Bidang Bisnis |
| Divisions: | Fakultas Sains & Teknologi > Teknik Informatika |
| Depositing User: | Hariyanto Rie |
| Date Deposited: | 03 Mar 2026 08:11 |
| Last Modified: | 03 Mar 2026 08:11 |
| URI: | https://repositori.buddhidharma.ac.id//id/eprint/3066 |
Actions (login required)
![]() |
View Item |

