Titel (deu): Entwicklung eines Verfahrens zur Identifikation von Spam-Mail mit künstlichen neuronalen Netzen

Autor: Weinberger, G. (Gerald)

Beschreibung (deu): St. Pölten, FH-Stg. Telekommunikation und Medien, Dipl.-Arb., 2009

Beschreibung (deu): Jährlich verursachen etwa 100 Milliarden Spam-Mails einen enormen wirtschaftlichen Schaden. Verschiedene, oft statische Filtermethoden versuchen Mails zu klassifizieren, um eine Spam-Filterung durchzuführen. Das in dieser Arbeit entwickelte Verfahren nutzt einen lernenden, dem menschlichen Gehirn nachempfundenen Mechanismus: Als Teilgebiet der Neuroinformatik erhält der Softwareentwickler mit einem künstlichen neuronalen Netz ein Werkzeug zur Lösung verschiedenster Aufgaben der Informatik. Für eine Spam-Identifikation wird die Datenmenge durch einen Preprozessor aufbereitet und dem neuronalen Netz zur Klassifikation übergeben, wobei unbekannte Daten einem Trainingsset zugeführt werden. Das neuronale Netz wächst durch erneutes Lernen dieser Trainingsmenge. Netze mit wenigen Neuronen erlauben eine eindeutige Klassifizierung von Mails. Bei größeren Netzen kommt es zu einem "Verwässern" des Wissens und eine eindeutige Erkennung des Eingabemusters ist nicht mehr möglich. Es bedarf weiterer Maÿnahmen um das Verfahren zu optimieren.

Beschreibung (eng): Annually more than 100 billion spam e-mails cause an enormous economic damage. Several existing static filter methods try to recognise spam by classifying mails. A procedure developed for this thesis uses a mechanism, which is similar to the
human brain having the ability of learning. As part of the neuro-computer science, an artificial neural network became a tool for developers to solve various tasks of computer science. To identify spam, the input data is passed through a preprocessor
before the neuronal network receives the mail for classification. Unknown data is stored in a trainingset. The neural network grows by re-learning from this trainingset. Networks consisting of a few neurons provide a explicit classification of mails. For larger networks, a dilution of knowledge occurs and consequently a explicit recognition of input patterns is no longer possible. Further tasks are required in order to optimize the procedure.

Sprache des Objekts: Deutsch

Datum: 2009

Rechte: © Alle Rechte vorbehalten

Klassifikation: Spam-Mail; Identifikation; Neuronales Netz

Permanent Identifier