ANLEITUNGEN
Im Folgenden wird erläutert, welche
Voraussetzungen
auf Ihrem PC vorliegen müssen um den ENTER zu verwenden, wie Sie den
ENTER starten
und ggf. eine ausführbare Datei des Entscheidungsbaum-Erstellers erzeugen können. Im Abschnitt
Funktionen wird kurz gezeigt, wie Sie den ENTER
verwenden können.
Detailliertere Informationen finden Sie in den jeweils verlinkten Video-Tutorials bzw. in den entsprechenden
Abschnitten des
Handbuchs.
Voraussetzungen
Die Software Entscheidungsbaum-Ersteller ENTER wird in Form von Python-Skripten zur Verfügung gestellt
und ist deshalb problemlos unter Windows nutzbar. Eine Nutzung unter MacOS und Linux ist prinzipiell auch
möglich. Allerdings wurde die Software noch nicht für diese Systeme getestet und optimiert. Damit Sie die
Software Entscheidungsbaum-Ersteller ENTER ausführen können, muss auf Ihrem System lediglich Python mit
dem Python-Paket Graphviz, sowie die Graphviz-Software installiert sein.
Herstellen der Voraussetzungen
- Installation von Graphviz:
Der ENTER benötigt für die Darstellung des Entscheidungsbaums in graphischer Form im Hintergrund eine
Installation der Software Graphviz bzw. deren Bibliotheken. Diese lässt sich einfach mit Hilfe
des von Graphviz zur Verfügung gestellten Installers installieren.
-
Laden Sie sich von der
Graphviz-Homepage
den Installer für Ihr System herunter.
-
Wichtig:
Aktivieren Sie bei Ausführung des Installers die Option Add Graphviz to the system
PATH
- Installation von Python:
Nutzen Sie für die Installation von Python am besten den auf der Python-Homepage zur Verfügung
gestellten Installer. Dieser richtet, neben der Installation, Python auf Ihrem System ein.
- Laden Sie sich den Python-Installer für Ihr System von der
Python-Hompage herunter.
- Wichtig:
Setzen Sie im ersten Fenster des Installers den Haken bei Add
python.exe to PATH
-
Klicken Sie dann auf „Install Now“. Dadurch wird Python installiert, die
notwendigen Tools eingerichtet und Python für die Verwendung vorbereitet.
- Installation des Python-Pakets Graphviz:
Am einfachsten lassen sich Pakete für Python mit dem Paket-Installer pip installieren. Dieser
wird bei Nutzung des Installers zur Installation von Python automatisch mitinstalliert.
- Öffnen Sie die Kommandozeile/Eingabeaufforderung (Windows).
- Geben Sie dort den Befehl
pip install graphviz
ein und bestätigen Sie den Befehl mit der Eingabetaste. Das Paket Graphviz wird nun automatisch
heruntergeladen und installiert.
Video-Tutorial Teil 01: Voraussetzungen
Der folgende Teil der Video-Tutorials zeigt, wie Sie die notwendigen Voraussetzungen auf Ihrem PC
herstellen.
Starten des ENTERs
Im Folgenden werden zwei unterschiedliche Möglichkeiten aufgezeigt, wie der ENTER gestartet werden kann. Weitere
Startmöglichkeiten finden Sie im Handbuch und Teil 2 des Video-Tutorials.
Laden Sie sich den ENTER herunter und entpacken Sie die heruntergeladene .zip-Datei.
- Start via Doppelklick:
Doppelklicken Sie auf die Datei Starte_ENTER.py. Es öffnet sich die
Oberfläche des Entscheidungsbaum-Erstellers.
Hinweis:
Wollen Sie verhindern, dass sich mit der Oberfläche des ENTERs eine Eingabeaufforderung öffnet, ändern
Sie die Dateiendung .py der Datei Starte_ENTER.py zu .pyw
- Start über die Eingabeaufforderung:
- Öffnen Sie den entpackten Ordner.
- Öffnen Sie eine Konsole für den geöffneten Ordner.
Rechtsklicken Sie hierfür in den Ordner und wählen In Terminal öffnen aus. Es öffnet sich
eine
Konsole, welche bereits den Pfad des Ordners besitzt.
Hinweis:
Bei älteren Windows-Versionen ist die Auswahl Im Terminal öffnen nicht verfügbar.
Im Handbuch ist erklärt, wie in diesem Fall vorzugehen ist.
- Geben Sie in der Konsole den Befehl
python Starte_ENTER.py
ein und bestätigten Sie den Befehl mit der Eingabetaste. Es öffnet sich die Oberfläche des
ENTERs.
Weitere Möglichkeiten den ENTER zu starten, sowie detailliertere Informationen finden Sie im Handbuch.
Erstellen einer ausführbaren Datei:
Mit Hilfe des Pakets PyInstaller (https://pyinstaller.org/en/stable/) ist es
möglich aus Python-Skripten ausführbare Dateien für Windows und MacOS zu erstellen. Eine solche ausführbare
Datei
kann auf einem beliebigen Rechner des jeweiligen Systems ausgeführt werden, ohne dass dafür eine Installation
von Python oder zusätzlicher Pakete notwendig ist, da diese in der ausführbaren Datei „gebündelt“ werden. Die
Installation der Graphviz-Software muss dennoch auf dem Rechner vorhanden sein, da diese nicht in
der ausführbaren Datei „gebündelt“ wird.
Auf dem Rechner, auf dem die ausführbare Datei erstellt wird, muss Python mit den notwendigen Paketen
installiert sein.
- Installation des PyInstallers:
Öffnen Sie eine Konsole und geben Sie dort den Befehl
pip install pyinstaller
ein. Bestätigen Sie den Befehl mit der Eingabetaste. Das Paket Pyinstaller wird nun automatisch
heruntergeladen und installiert.
- Erstellen einer ausführbaren .exe-Datei:
- Öffnen Sie die Konsole im Ordner des Entscheidungsbaum-Erstellers, d.h. in
dem Ordner, in dem sich die Datei Starte_ENTER.py befindet.
- Geben Sie den Befehl
pyinstaller --noconfirm --windowed --onefile
--name ENTER_Entscheidungsbaum_Ersteller
--icon Grafiken/Logo_Entscheidungsbaum.ico Starte_ENTER.py
ein und bestätigen Sie den Befehl mit der Eingabetaste.
Die ausführbare Datei wird nun erstellt. Das kann einige Minuten dauern.
-
Im Ordner des Entscheidungsbaum-Erstellers wurde automatisch ein Ordner dist erstellt,
welcher die ausführbare Datei enthält.
Kopieren Sie den Ordner Grafiken in den erstellten dist-Ordner.
- Doppelklick auf die .exe-Datei startet nun den Entscheidungsbaum-Ersteller.
- Wenn Sie die ausführbare Datei auf einem anderen Rechner nutzen wollen, kopieren
Sie den dist-Ordner (mit enthaltenem Ordner Grafiken) auf den anderen Rechner.
Auf diesem muss kein Python installiert sein. Lediglich die Graphviz-Software (siehe
Voraussetzungen) muss
installiert sein.
Weitere Informationen finden Sie im Handbuch des ENTERs.
Hinweis:
Die Lizenzen der ggf. gebündelten Dateien sind zu beachten.
Video-Tutorial Teil 02: Starten des ENTERs
Der folgende Teil der Video-Tutorials beinhaltet verschiedene Möglichkeiten den ENTER zu starten und zeigt,
wie Sie eine ausführbare Datei des ENTERs erstellen können.
Hinweis:
Die im Video als Start_Entscheidungsbaum.py bezeichnete Datei
entspricht der Datei Starte_ENTER.py
des ENTERs ab der Version 1.3.
Verwenden Sie an den entsprechneden Stellen diesen neuen Dateinamen.
Funktionen des ENTERs
Im Folgenden werden die wichtigsten Schritte für die Hauptverwendungszwecke des ENTERs kurz erklärt.
Ergänzend dazu wird das Ansehen von Teil 3 der Video-Tutorials empfohlen.
Detaillierte Informationen über alle Funktionen des ENTERs finden Sie im Handbuch des
Entscheidungsbaum-Erstellers.
- Erstellen eines Entscheidungsbaums:
- Laden Sie einen Trainingsdatensatz in den
ENTER durch Klick auf den Button Öffnen. Die geladenen Trainingsdaten werden automatisch in
der Ansicht Trainingsdaten angezeigt.
- Wählen Sie im Bereich Informationsgewinn ein Split-Kriterium aus, welches
für die Berechnung des besten Attributs verwendet werden soll. Zur Verfügung stehen u.a. Fehlklassifikationen
zählen, Entropie,....
- (Optional) Wählen Sie die von Ihnen gewünschten Hyperparameter im
Bereich Hyperparameter durch Aktivierung der jeweiligen Checkbox und Eingabe des gewünschten
Werts im jeweiligen Eingabefeld aus. Eine Erläuterung der zur Verfügung stehenden Hyperparameter
finden Sie im Handbuch.
- Durch Klick auf den Button Entscheidungsbaum erstellen wird ein
Entscheidungsbaum mit den von Ihnen geladenen Trainingsdaten unter Verwendung des ausgewählten
Split-Kriteriums und unter Berücksichtigung von ggf. ausgewählten Hyperparametern trainiert.
Der trainierte Entscheidungsbaum wird unter Ansicht Entscheidungsbaum angezeigt.
- Testen eines Entscheidungsbaums:
Voraussetzung für das Testen ist, dass bereits ein Entscheidungsbaum trainiert ist.
- Durch Klick auf den Button Testmodus aktivieren wird das Testen des
trainierten Entscheidungsbaums ermöglicht.
- Laden Sie in der Ansicht Testphase die Testdaten durch Klick auf den Button
Öffnen in den ENTER. Diese werden nun unter Testdaten angezeigt.
- Durch Klick auf den Button Ausführen werden die geladenen Testdaten mit dem
trainierten Entscheidungsbaum ausgewertet und es wird jeweils das vom Baum berechnete Label mit dem
Label des Testdatenpunkts verglichen. Unter Berechnete Labels werden die vom Baum berechneten
Labels angezeigt.
Stimmt das berechnete Label nicht mit dem erwarteten Label des Testdatenpunkts überein, wird der
jeweilige Eintrag rot hervorgehoben.
- Durch Klick auf den Button Ausführen im vorherigen Schritt wurde auch die
Ansicht Konfusionsmatrix und Gütemaß eingeblendet.
In dieser Ansicht finden Sie eine
übersichtliche Darstellung der Ergebnisse des Testens in Form einer Konfusionsmatrix und die
Berechnung des Gütemaßes Genauigkeit.
- Automatische Datenaufteilung:
- Laden Sie einen Datensatz, welchen Sie als Trainings- und Testdatensatz verwenden
möchten, durch Klick auf den Button Öffnen in den ENTER.
- Geben Sie im Bereich Autom. Datenaufteilung den Prozentsatz ein, welcher
für die Trainingsdaten aus dem geladenen Datensatz verwendet werden soll.
Aktivieren Sie dann
die Checkbox Anteil der Trainingsdaten in %.
Die geladenen Daten werden nun in Trainings- und Testdaten aufgeteilt. Der auf die Trainingsdaten
entfallende Teildatensatz wird direkt unter Ansicht Trainingsdaten angezeigt. Die
verbleibenden Daten werden als Testdaten verwendet und in der Oberfläche des Testmodus angezeigt.
Diese ist erst nach dem Training eines Baums sichtbar.
- Durch Klick auf den Button Entscheidungsbaum erstellen wird ein
Entscheidungsbaum mit dem auf die Trainingsdaten entfallenden Anteil des geladenen Datensatzes
trainiert.
Video-Tutorial Teil 03: Funktionen
Der folgende Teil der Video-Tutorials zeigt, welche Funktionen der ENTER im Detail bietet und wie Sie diese
verwenden können.