Blog

Terminologie extrahieren - nur 7% Fehlquote

von Julia Bischoff (Kommentare: 0)

Nachdem wir uns in die Theorie der Termextraktion eingearbeitet haben, geht es heute an die Praxis.

Wenden wir uns also den Erkenntnissen unseres Vergleichs zu:

Zeitaufwand:
Wie schon im letzten Blogbeitrag erwähnt ist die linguistische Extraktion 45-mal schneller als die manuelle Extraktion.

Genauigkeit:
Von den 666 möglichen Termen hat die linguistische Extraktion mit 638 die meisten Terme gefunden. Die manuelle Extraktion folgt auf dem zweiten Platz mit ca. 200 Termen weniger. Die statistische Extraktion hat in jeder ihrer Ausführungen leider nur 50% brauchbare Ergebnisse geliefert, im schlechtesten Fall 12-mal weniger Terme als die linguistische Extraktion.

Fehlquote:
Auch bei den nicht gefundenen Termen schneidet somit die linguistische Extraktion am besten ab. Mit nur 6,6% Fehlquote im Verhältnis zu 92% für den schlechtesten Durchlauf bei der statistischen Extraktion, liegt sie klar vorne.

Fehlquote bei Termextraktion

Wie man sieht, ist das Ergebnis eindeutig.

Gleichzeitig ist es jedoch wichtig zu unterscheiden: Existiert bereits eine Terminologie oder fangen sie bei Null an?

Daher ist wichtig, je nach Infrastruktur und Ausgangssituation die richtige Strategie umzusetzen, um ein qualitativ gutes und der Preis-Leistung entsprechendes Ergebnis zu erhalten.

 

 

Eine umfangreiche Liste an Programmen zur Termextraktion und ein Glossar mit Fachwörtern finden sie in unserem Basiswissen.

Zurück

Einen Kommentar schreiben