Modul 3: KI Zertifikat Hertie School
Wir widmen uns einem bekannten Beispiel aus Ihrem beruflichen und privaten Alltag: E-Mail Spam. Maschinelles Lernen wird zur Klassifierung von Spam E-Mails eingesetzt, was Sie in dieser Übung selbst durchführen werden. In diesem GitHub Repository haben wir den notwendigen Datensatz und Code hinterlegt. Mit einem Klick auf das Google Colab Symbol gelangen Sie zum Notebook.
Referenz: Xydi, Panagiota (2020): Text classification hands-on exercise, EPFL Extension School Workshop, Applied Machine Learning Days. Müller, Andreas C.; Guido, Sarah (2017): Introduction to Machine Learning with Python. A Guide for Data Scientists. O’Reilly Sebastopol, CA. Chapter 7. Working with Text Data, p. 329-362.
Datensatz: Apache Spam Assassin enthält ca. 6.000 gelabelte E-Mails mit einem Spam-Anteil von etwa 30 %.