Basiswissen

im Bereich Terminologie und Übersetzung

Normen

Zertifizierung nach ISO 17100

weiterführende Informationen

Glossar

100%-Match

Übersetzer übersetzen Texte mit Unterstützung von Translation Memory Systemen. Diese Systeme speichern bereits übersetzte Sätze - meist "Segmente" genannt - zweisprachig ab. Diese Sätze werden dem Übersetzer wieder vorgeschlagen, sobald diese im selben oder in einem neuen Dokument wieder auftauchen.
Der Grad der Übereinstimmung zwischen einem neu zu übersetzenden Satz und einem bereits im Translation Memory gespeicherten Satz wird als Prozentzahl ausgedrückt.
Stimmen ein neu zu übersetzender Satz und ein bereits im Translation Memory gespeicherter Satz - in Inhalt und Formatierung - exakt überein, so handelt es sich um ein 100%-Match.

Abzüge

Der Grad der Übereinstimmung zwischen einem neu zu übersetzenden Satz und einem bereits im Translation Memory hinterlegten Satz wird als Prozentzahl ausgedrückt.
Stimmen ein neu zu übersetzender Satz und ein bereits im Translation Memory gespeicherter Satz - in Inhalt und Formatierung - exakt überein, so handelt es sich um ein 100%-Match.
Im Translation Memory können prozentuale Abzüge aufgrund von Unterschieden in Inhalt oder Formatierung festgelegt werden. So kann beispielsweise ein Abzug festgelegt werden, der angewendet wird, wenn die Formatierung des im Translation Memory hinterlegten Satzes von der Formatierung im neu zu übersetzenden Satz abweicht.
Ein Match mit einer Übereinstimmung unterhalb von 100% wird als Fuzzy-Match bezeichnet.

Alignment

Mit einem Alignment-Tool kann der Inhalt eines Translation Memory Systems erarbeitet werden. Das Alignment-Tool ermöglicht es, Satzpaare aus vorhandenen Übersetzungen zu bilden.
Hierbei werden Ausgangstext und Übersetzung in Segmente (Satzpaare) eingeteilt. Jedem quellsprachlichen Segment wird das entsprechende zielsprachliche Segment zugeordnet. Diese können dann in ein Translation Memory importiert werden.

Begriff

Der Begriff bezeichnet eine Denkeinheit, die aus einer Menge von Gegenständen unter Ermittlung der diesen Gegenständen gemeinsamen Eigenschaften mittels Abstraktion gebildet wird (DIN 2342, Teil 1).
Demzufolge existieren Begriffe nur in gedanklicher Form. Sie stellen nichts Sprachliches dar, sondern existieren nur im Kopf. Sie sind eine Vorstellung von etwas, eine Idee.

begriffsorientiert

Begriffsorientiert bedeutet, dass in einem Datensatz nicht von einem Wort ausgegangen wird, das in diesem Datensatz mit allen seinen möglichen Bedeutungen behandelt wird, sondern jeder Bedeutung eines Wortes (jedem Begriff, jedem gedanklichen Konzept) ein eigener Datensatz gewidmet wird

Benennung

Die Benennung hat die Aufgabe, den Begriff sprachlich zu bezeichnen. Sie kann aus einem oder mehreren Wörtern bestehen und verleiht dem Gegenstand einen Namen (DIN 2342, Teil 1).

benennungsorientiert

Benennungsorientiert bedeutet, dass alle möglichen Bedeutungen einer Benennung in einem Datensatz abgehandelt werden.

computergestützte Übersetzung

Akronym CAT (von Computer Aided Translation).

Der Mensch übersetzt, der Computer unterstützt ihn dabei durch ein automatisiertes Nachschlagen von Terminologie und ein automatisiertes Vergleichen aktuell zu übersetzender Texte mit früheren Übersetzungen (Translation Memory).

Im Gegensatz zur maschinellen Übersetzung (MT) übersetzen Programme zur computergestützten Übersetzung (CAT-Tools) nicht selbst, sondern unterstützen den Humanübersetzer bei seiner Arbeit.

CAT-Programm

Von Computer Aided Translation.

Auch als Übersetzungssoftware, Übersetzungs-Tool oder CAT-Tool bezeichnet.

CAT-Programme bestehen meist aus folgenden Teilsystemen:

  • Terminologiedatenbank
  • Translation Memory
  • Projektmanagement-Komponente
  • Alignment-Tool

 

Controlled Language Checker

So genannte Sprachprüfprogramme (Controlled Language Checker / Autorenunterstützung / Sprachprüfwerkzeug) können die Einhaltung von Schreibregeln überprüfen. Sie unterstützen dadurch den Technischen Redakteur beim Schreiben in kontrollierter Sprache, indem sie z.B. Dokumente auf die Einhaltung firmenintern festgelegter Fachbegriffe überprüfen.

DTD

Akronym von Document Type Definition.

Dokumenttypdefinition, die die Struktur sowie die Elemente und Attribute von XML-Dokumenten definiert.

Dublette

Redundanz im Translation Memory, bei der mehrere Übersetzungen zu einem Quellsegment vorliegen.

Extraktionsverfahren

Es gibt unterschiedliche Vorgehensweisen bei der Termextraktion.

Statistisches Extraktionsverfahren
Bei statistischen Termextraktions-Programmen wird davon ausgegangen, dass es sich in Fachtexten bei besonders häufig vorkommenden Wörtern um Terminologie handelt.

Linguistisches Extraktionsverfahren
Extraktionsprogramme mit einem linguistischen Ansatz haben ein enormes einzelsprachiges Wissen (z. B. über Wortbildungsregeln) hinterlegt und werden für einzelne Sprachen (zurzeit vor allem für Deutsch und Englisch) angeboten.

Halbautomatische Termextraktion
Bei der halbautomatischen Termextraktion werden Termkandidaten extrahiert, die in einem weiteren Schritt von einem Terminologen überprüft und ausgewählt werden müssen.

Automatische Termextraktion
Bei der automatische Termextraktion entfällt der Schritt der Auswahl durch einen Terminologen, da der Computer selbst eine Überprüfung und Gewichtung der Termkandidaten vornimmt.

Fuzzy Match

Ein Suchtreffer im Translation Memory, der standardmäßig eine Match-Quote von 50-99 % aufweist. Der bereits im Translation Memory hinterlegte Satz stimmt in Form und Inhalt nicht zu 100% mit dem zu übersetzenden Satz überein.

Gegenstand

Der reale (physische) Gegenstand, der durch die Benennung und den Begriff beschrieben wird (vgl. Semiotisches Dreieck).

Homograph

Benennung mit unterschiedlicher Aussprache oder Betonung bei gleicher Schreibweise wie eine andere.

Beispiel: modérn (aktuell) – módern (verfaulen)

Homonym

Als Homonym bezeichnet man eine Benennung, die für verschiedene Begriffe steht.
Dabei sind die Bedeutungen einer Benennung so verschieden, dass sie (anders als bei Polysemie) in keinem erkennbaren begrifflichen Zusammenhang mehr stehen.

Beispiel: Kiefer (eine Baumart) – Kiefer (Knochen des Kopfes)

Internationalisierung

Unter Internationalisierung versteht man die Entwicklung eines Produktes einschließlich der Dokumentation im Hinblick auf eine leichte Anpassung an andere Märkte (Sprachen und Kulturen).

Kein Match

Für den zu übersetzenden Satz (Segment) wurde kein Treffer im Translation Memory gefunden bzw. die prozentuale Übereinstimmung lag unterhalb der festgelegten Trefferschwelle (Match-Quote).

Kompositum

Ein Kompositum (Plural Komposita) ist ein aus mehreren Wörtern zusammengesetztes Wort.

Konkordanzsuche

Suche von einzelnen oder mehreren Wörtern in einem Translation Memory.

Kontext-Match

Auch 101%-Match genannt.

Ein Kontext-Match ist ein Match, bei dem zusätzlich zu den Eigenschaften eines normalen 100%-Matches auch der Kontext (Sätze vor und nach dem zu übersetzenden Satz) übereinstimmt.

kontrollierte Sprache

Eine kontrollierte Sprache ist eine natürliche Sprache, die nach bestimmten Regeln eingeschränkt wird.
Ziel ist es, technische Dokumentationen verständlicher und übersetzungsgerechter zu verfassen.

Beispiel: Simplified (Technical) English

Lokalisierung

Lokalisierung bezieht sich auf die Anpassung der Technischen Dokumentation an die Sprache und die kulturellen Anforderungen eines bestimmten Landes.

LSP

Akronym von Language Service Provider.

Englisch für Übersetzungs-/Sprachdienstleister.

Match

Wird in einem Translation Memory eine Suche durchführt, so wird der Inhalt und die Formatierung des aktuellen Satzes/Segments mit Sätzen/Segmenten in derselben Sprache im Translation Memory verglichen.
Ein Match ist eine vollständige oder teilweise Übereinstimmung des zu übersetzenden Satzes/Segments mit einem im Translation Memory gespeicherten Satz/Segment.
Der Grad des Matches wird als Prozentzahl ausgedrückt.

Match-Quote

Prozentzahl, die den Grad der Übereinstimmung eines Satzes/Segments mit einem im Translation Memory gespeicherten Satz/Segment angibt.

Man unterscheidet Kontext-Match, 100%-Match, Fuzzy-Match und Kein Match.

Mehrwortbenennung

Benennung, die aus mindestens zwei durch Leerstellen getrennten Wörtern besteht. (DIN 2342)

maschinelle Übersetzung

Abkürzung MÜ.

Englisch: Machine Translation (Abkürzung MT).

Im Gegensatz zur computergestützten Übersetzung (CAT) erfolgt eine maschinelle Übersetzung (MT) vollautomatisch ohne die Notwendigkeit eines Humanübersetzers.

Noise

Maßzahl einer qualitativen Termextraktion.

Extraktionstools produzieren wesentlich umfangreichere Listen, als der Mensch als Terminologe das vermutlich tun würde. Zahlreiche Wortkombinationen werden vom Extraktionstool als Termkandidaten ausgegeben, die in Wahrheit keinen terminologischen Wert haben. Zahlreiche Wortformen werden nicht als zusammengehörig erkannt. Folglich müssen diese fälschlich produzierten Vorschläge aus den Listen wieder gestrichen werden.

Normzeile

Die Normzeile ist eine in der Übersetzungsbranche übliche Größe zur Abrechnung von Übersetzungen. Eine Normzeile umfasst in Deutschland standardmäßig eine Länge von 50 - 55 Anschlägen einschließlich der Leerzeichen. 30 Normzeilen ergeben normalerweise eine Normseite.

Polysem

Als Polysem bezeichnet man eine Benennung, die für verschiedene Begriffe steht.

Polyseme haben mehrere Bedeutungen, die untereinander ähnlich sind (Bedeutungsvarianten). Polysemie bedeutet eine systematische Mehrdeutigkeit.

Ist dies bei mehrdeutigen Wörtern nicht der Fall, so liegt stattdessen Homonymie vor.
Eine Unterscheidung zwischen Homonymie und Polysemie kann oftmals problematisch sein.

Relais-Übersetzung

Bei einer Relais-Übersetzung wird der Ausgangstext zunächst in eine Drittsprache übersetzt, da es für die direkte Übersetzung keinen passenden Übersetzer gibt.

Bei der Relais-Übersetzung wird z. B. vom Portugiesischen ins Finnische übersetzt, indem zunächst eine Übersetzung ins Französische oder Englische - das genügend Übersetzer oder Dolmetscher beherrschen - zwischengeschaltet wird.

Semiotisches Dreieck

Das semiotische Dreieck stellt die Relation zwischen der Benennung, dem dadurch hervorgerufenen Begriff und dem damit gemeinten realen Gegenstand dar.

Silence

Maßzahl einer qualitativen Termextraktion.

Unter Silence versteht man den Umstand, dass Extraktionstools im Text enthaltene Termini nicht als Vorschläge erkennen. Die Silence sollte so gering wie möglich sein.

Stoppwort

Stoppwörter sind meist nicht sinntragend und übernehmen häufig grammatikalische Funktionen im Text. Durchschnittlich handelt es sich bei zwischen 30% und 50% der Wörter eines Textes um Stoppwörter. Bei einer Termextraktion werden Stoppwörter herausgefiltert und somit nicht als Termkandidaten vorgeschlagen.

Beispiele:
Bestimmte Artikel: der, die, das
Unbestimmte Artikel: eine, einer
Bindewörter: der, und, mit
Präpositionen: bis, um, durch, an

Synonym

Zwei Ausdrücke (lexikalische Zeichen) sind genau dann synonym, wenn sie dieselbe (denotative) Bedeutung haben, also bedeutungsgleich sind.

TBX

Akronym von TermBase eXchange

XML-basiertes Format mit dem ein standardisierter Austausch von Beständen aus Terminologiedatenbanken erfolgen kann.

Term

Die Einheit aus einem Begriff und seiner Benennung.

Terminologie

Auch als Fachwortschatz bezeichnet.

Gesamtbestand der Begriffe und ihrer Benennungen in einem Fachgebiet (DIN 2342).

Terminologiedatenbank

Die Terminologie in elektronischer Form.

Sie kann als Excel-Tabelle im csv-Format, im terminologieeigenen tbx-Format oder in einem anderen speziellen Format vorliegen. So kann die Terminologie in Softwareprogramme zur Verwaltung und Anzeige eingespielt werden.

Terminologieextraktion

Auch als Termextraktion bezeichnet.

Entweder die Extraktion von Termen aus einem Text mit dem Ziel, die zielsprachlichen Entsprechungen festzulegen.

Oder die Extraktion von Termen und ihren zielsprachlichen Entsprechungen aus einem Translation Memory mit dem Ziel eine Terminologie(datenbank) aufzufüllen.

Terminologiemanagement

Auch als Terminologiearbeit bezeichnet.

Terminologiemanagement umfasst die Erarbeitung, Speicherung, Pflege und Nutzung von Fachwörtern, mit dem Ziel einer unternehmensweiten, konsistenten und effizienten Verwendung von Terminologie.

Terminologieverwaltungssystem

Auch als Terminologiemanagementsystem, Terminologietool bezeichnet.

Abkürzung: TSV.

Eine Software mit der eine Terminologie aufgebaut, dargestellt und bearbeitet werden kann. Es beinhaltet eine Terminologiedatenbank.

Thesaurus

Ein Thesaurus ist ein kontrolliertes Vokabular, dessen Begriffe durch Relationen miteinander verbunden sind (Wortnetz).

Translation Memory

Abkürzung TM.

Ein Translation Memory ist eine Datenbank zur strukturierten Speicherung von Übersetzungen. Diese Datenbank ist die Hauptkomponente von Systemen zur computergestützten Übersetzung (CAT-Tools). In einem Translation Memory werden Übersetzungen (Satzpaare) während der Arbeit kontinuierlich gespeichert, damit sie künftig für neu zu erstellende Übersetzungen wiederverwendet werden können.

Translation-Memory-System

Abkürzung TMS.

Ein Translation-Memory-System ist eine System zur computergestützten Übersetzung (CAT-Tools). In einem Translation-Memory-System werden dem Übersetzer während seiner Arbeit kontinuierlich im TM gespeicherte Übersetzungen (Satzpaare) angezeigt. Diese erleichtern dem Übersetzer seine Arbeit.

TMX

Akronym von Translation Memory eXchange

TMX ist ein XML-basiertes Format für den standardisierten Austausch von Translation Memory-Daten.

Übersetzungsmanagement

Das Übersetzungsmanagement umfasst die Verwaltung, Steuerung und Überwachung von Übersetzungsprozessen. Hierzu zählen die Einholung von Angeboten, Definition und Kontrolle von Terminen, Bereitstellung der erforderlichen Ressourcen, Verteilung aller Aufgaben an die entsprechenden Akteure, Qualitätssicherung und schließlich die Archivierung.

Unwort

Unwörter sind alternative Benennungen für denselben Begriff, die in der Begriffsbeschreibung identifiziert werden.

Es ist wichtig solche Synonyme in den Datenbestand aufzunehmen und als Unwort zu deklarieren.

Vorübersetzung

Eine Vorübersetzung ist ein automatisierter Vergleich eines neu zu übersetzenden Textes mit dem gespeicherten Translation Memory und der anschließenden Übernahme der Matches in den Zieltext zur Unterstützung des Übersetzers.

XLIFF

Das XML Localization Interchange File Format, abgekürzt XLIFF, ist ein XML-Format zur Darstellung hierarchisch strukturierter Daten in Übersetzungs-Tools (CAT-Tools).

Wir möchten darauf hinweisen, das wir für den Inhalt der verlinkten Seiten keine Haftung übernehmen
und keine Garantie für die Vollständigkeit dieser Seite geben können.