Penelitian menunjukkan bahwa terdapat lebih dari 3 milyar akun email di dunia dengan frekuensi pengiriman email sekitar 205 – 294 milyar setiap hari. Salah satu masalah yang muncul dari pengiriman email yang luar biasa ini adalah adanya spam email. Salah satu solusi untuk mengatasi permasalahan spam email tersebut adalah dengan teknik penyaringan spam email. Penyaringan spam email dapat dilakukan dengan menggunakan pendekatan teori berbasis pembelajaran, yaitu dengan klasifikasi. Penelitian ini menerapkan algoritma Naive Bayes untuk melakukan klasifikasi spam email sehingga dari dataset email, akan dikelompokkan menjadi 2 yaitu spam email dan non- spam email. Hasil uji dengan menggunakan k-fold cross validation sebagai pembagian data latih dan data uji, menghasilkan kesimpulan bahwa nilai rata – rata data terklasifikasi benar adalah sebesar 3903, sedangkan nilai rata – rata data terklasifikasi salah adalah sebesar 698, rata – rata akurasi sebesar 84.8%, sedangkan rata – rata precision dan recall berturut – turut adalah 0.86 dan 0.85. Akurasi, precision, dan recall tertinggi diperoleh ketika menggunakan nilai k=9. Kata kunci: deteksi, klasifikasi, spam email, naive bayes ABSTRACT Research shows that there are more than 3 billion email accounts in the world with a frequency of sending emails around 205 - 294 billion every day. One problem that arises from sending this extraordinary email is the existence of spam email. One solution to overcome the problem of email spam is by email spam filtering techniques. Email spam filtering can be done using a learning-based theory approach, namely classification. This study applies the Naive Bayes algorithm to classify email spam so that from the email dataset, it will be grouped into 2 namely spam email and non-spam email. The test results using k-fold cross validation as a division of training data and test data, resulting in the conclusion that the average value of correctly classified data is 3903, while the average value of classified data is 698, the average accuracy is 84.8% , while the average precision and recall are 0.86 and 0.85, respectively. The highest accuracy, precision, and recall are obtained when using the value k = 9. Keywords: detection, classification, spam email, naive bayes