Skip to content

1d438ef6/Authorship-Detection

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

70 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Authorship Detection: Style Change Detection

Softwarprojekt an der HS Mittweida, Studiengang Allgemeine und Digitale Forensik

Task

  1. Erkennen ob ein Dokument von mehreren Autoren geschrieben wurde.
  2. Erkennen welche Absätze in einem Dokument vom gleichen und welche von unterschiedlichen Autoren geschrieben wurden.

Usage

Folgende Bibliotheken müssen installiert werden (pip install Bibliotheksname):

  • rpy2
  • langdetect
  • pandas
  • numpy
  • matplotlib
  • sklearn
  • joblib

Task 1

Pfade in der Datei 'kNN.py' anpassen und diese anschließend ausführen.

Task 2

Pfade in der Datei 'random_forest1.py' anpassen und auskommentieren bzw. Kommentare aufheben entsprechend dem was man machen will (siehe Kommentare im Quelltext). Anschließend müssen noch die fertig trainierten Random Forest Klassifikatoren in den Projektordner verschoben werden. Danach kann man die Datei ausführen.

About

Softwareprojekt Forensik

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 2

  •  
  •