Softwarprojekt an der HS Mittweida, Studiengang Allgemeine und Digitale Forensik
- Erkennen ob ein Dokument von mehreren Autoren geschrieben wurde.
- Erkennen welche Absätze in einem Dokument vom gleichen und welche von unterschiedlichen Autoren geschrieben wurden.
Folgende Bibliotheken müssen installiert werden (pip install Bibliotheksname):
- rpy2
- langdetect
- pandas
- numpy
- matplotlib
- sklearn
- joblib
Pfade in der Datei 'kNN.py' anpassen und diese anschließend ausführen.
Pfade in der Datei 'random_forest1.py' anpassen und auskommentieren bzw. Kommentare aufheben entsprechend dem was man machen will (siehe Kommentare im Quelltext). Anschließend müssen noch die fertig trainierten Random Forest Klassifikatoren in den Projektordner verschoben werden. Danach kann man die Datei ausführen.