Basiswissen

im Bereich Terminologie und Übersetzung

 

 

 

 

 

 

 

 

 

Normen

Fachliteratur

Zertifizierung nach ISO 17100

Glossar

100%-Match

Übersetzer übersetzen Texte mit Unterstützung von Translation-Memory-Systemen. Diese Systeme speichern bereits übersetzte Sätze - meist "Segmente" genannt - zweisprachig ab. Diese Sätze werden dem Übersetzer wieder vorgeschlagen, sobald diese im selben oder in einem neuen Dokument wieder auftauchen.

Der Grad der Übereinstimmung zwischen einem neu zu übersetzenden Satz und einem bereits im Translation Memory gespeicherten Satz wird als Prozentzahl ausgedrückt.
Stimmen ein neu zu übersetzender Satz und ein bereits im Translation Memory gespeicherter Satz - in Inhalt und Formatierung - exakt überein, so handelt es sich um ein 100%-Match.

Abzüge

Der Grad der Übereinstimmung zwischen einem neu zu übersetzenden Satz und einem bereits im Translation Memory hinterlegten Satz wird als Prozentzahl ausgedrückt.
Stimmen ein neu zu übersetzender Satz und ein bereits im Translation Memory gespeicherter Satz - in Inhalt und Formatierung - exakt überein, so handelt es sich um ein 100%-Match.

Im Translation Memory können prozentuale Abzüge aufgrund von Unterschieden in Inhalt oder Formatierung festgelegt werden. So kann beispielsweise ein Abzug individuell festgelegt werden, wenn die Formatierung des im Translation Memory hinterlegten Satzes von der Formatierung im neu zu übersetzenden Satz abweicht.

Ein Match mit einer Übereinstimmung unterhalb von 100% wird als Fuzzy-Match bezeichnet.

Alignment

Mit einem Alignment-Tool kann der Inhalt eines Translation-Memory-Systems erarbeitet werden. Das Alignment-Tool ermöglicht es, Satzpaare aus vorhandenen Übersetzungen zu bilden.
Hierbei werden Ausgangstext und Übersetzung in Segmente (Satzpaare) eingeteilt. Jedem quellsprachlichen Segment wird das entsprechende zielsprachliche Segment zugeordnet. Diese können dann in ein Translation Memory importiert werden.

Begriff

Der Begriff bezeichnet eine "Denkeinheit, die aus einer Menge von Gegenständen unter Ermittlung der diesen Gegenständen gemeinsamen Eigenschaften mittels Abstraktion gebildet wird" (DIN 2342).

Ein Begriff umfasst also alle Gegenstände die gemeinsame Eigenschaften haben, z. B. Computermäuse in ihren unterschiedlichen Ausführungen. Somit ist die Denkeinheit „Computermaus“ ein abstrakter Begriff eines Gegenstandes.

Demzufolge existieren Begriffe nur in gedanklicher Form. Sie stellen nichts Sprachliches dar, sondern existieren nur im Kopf. Sie sind eine Vorstellung von etwas, eine Idee.

begriffsorientiert

Begriffsorientiert bedeutet, dass in einem Datensatz nicht von einem Wort ausgegangen wird, das in diesem Datensatz mit allen seinen möglichen Bedeutungen behandelt wird, sondern jeder Bedeutung eines Wortes (jedem Begriff, jedem gedanklichen Konzept) ein eigener Datensatz gewidmet wird.

In einer begriffsorientierten Datenbank wird also für jeden Begriff ein eigener Datensatz angelegt. Dies erleichtert vorallem die Suche nach Synonymen und äquivalenten Übersetzungen, da alle Benennungen für ein gedankliches Konstrukt in einem Datensatz (Terminologieeintrag) zusammengefasst sind.

Terminologiedatenbanken sollten bevorzugt begriffsorientiert aufgebaut sei.

Benennung

Auch Term, Terminus, Fachwort oder Fachausdruck genannt.

Eine Benennug ist eine "sprachliche Bezeichnung eines Allgemeinbegriffs aus einem Fachgebiet" (DIN 2342).

Die Benennung hat die Aufgabe, den Begriff sprachlich oder schriftlich zu bezeichnen. Sie kann aus einem oder mehreren Wörtern, aber auch aus Symbolen bestehen und verleiht dem Gegenstand dadurch einen Namen.

Jedes gedruckte Wort in einem Buch ist beispielsweise eine Benennung. In jeder Sprache ist die Benennung daher anders, wohingegen der Begriff (das Gedankenkonstrukt) über Landesgrenzen hinweg gleich bleibt.

benennungsorientiert

Benennungsorientiert bedeutet, dass in einem Datensatz von einem Wort (Benennung) ausgegangen wird, das in diesem Eintrag mit allen seinen möglichen Bedeutungen behandelt wird.

Homonyme würden in einer benennungsorientierten Datenbank also in einen einzigen Terminologieeintrag eingetragen werden.

Wörterbücher können beispielsweise benennungsorientiert aufgebaut sein.

computergestützte Übersetzung

Akronym CAT (von Computer Aided Translation).

Der Mensch übersetzt, der Computer unterstützt ihn dabei durch ein automatisiertes Nachschlagen von Terminologie und ein automatisiertes Vergleichen aktuell zu übersetzender Texte mit früheren Übersetzungen (Translation Memory).

Im Gegensatz zur maschinellen Übersetzung (MT) übersetzen Programme zur computergestützten Übersetzung (CAT-Tools) nicht selbst, sondern unterstützen den Humanübersetzer bei seiner Arbeit.

CAT-Programm

Von Computer Aided Translation.

Auch als Übersetzungssoftware, Übersetzungs-Tool oder CAT-Tool bezeichnet.

CAT-Programme bestehen meist aus folgenden Teilsystemen:

  • Terminologiedatenbank
  • Translation Memory
  • Projektmanagement-Komponente
  • Alignment-Tool

 

Controlled Language Checker

Auch Sprachprüfprogramm, Autorenunterstützung oder Sprachprüfwerkzeug genannt.

Controlled Language Checker können die Einhaltung von Schreib- und Stilregeln überprüfen. Sie unterstützen dadurch den Technischen Redakteur beim Schreiben in kontrollierter Sprache, indem sie z.B. Dokumente auf die Einhaltung firmenintern festgelegter Fachbegriffe überprüfen.

Datensatz

Auch Terminologieeintrag genannt.

Ein Datensatz ist eine abgeschlossene Einheit innerhalb einer Terminologieatenbank. Ein Datensatz enthält typischerweise mehrere Datenkategorien, die sich in der Struktur und Beschaffenheit in jedem weiteren Datensatz derselben Datenbank wiederholen.

DTD

Akronym von Document Type Definition.

Dokumenttypdefinition, die die Struktur sowie die Elemente und Attribute von XML-Dokumenten definiert.

Dublette

Redundanz im Translation Memory, bei der mehrere Übersetzungen zu einem Quellsegment vorliegen.

Extraktionsverfahren (Terminologie)

Es gibt unterschiedliche Vorgehensweisen bei der Termextraktion.

Statistisches Extraktionsverfahren
Bei statistischen Termextraktions-Programmen wird davon ausgegangen, dass es sich in Fachtexten bei besonders häufig vorkommenden Wörtern um Terminologie handelt.

Linguistisches Extraktionsverfahren
Extraktionsprogramme mit einem linguistischen Ansatz haben ein enormes einzelsprachiges Wissen (z. B. über Wortbildungsregeln) hinterlegt und werden für einzelne Sprachen (zurzeit vor allem für Deutsch und Englisch) angeboten.

Halbautomatische Termextraktion
Bei der halbautomatischen Termextraktion werden Termkandidaten extrahiert, die in einem weiteren Schritt von einem Terminologen überprüft und ausgewählt werden müssen.

Automatische Termextraktion
Bei der automatische Termextraktion entfällt der Schritt der Auswahl durch einen Terminologen, da der Computer selbst eine Überprüfung und Gewichtung der Termkandidaten vornimmt.

Fuzzy Match

Der Grad der Übereinstimmung zwischen einem neu zu übersetzenden Satz und einem bereits im Translation Memory hinterlegten Satz wird als Prozentzahl ausgedrückt.

Ein Suchtreffer im Translation Memory, der standardmäßig eine Match-Quote von 50-99 % aufweist wird als Fuzzy-Match bezeichnet. Der bereits im Translation Memory hinterlegte Satz stimmt in Form und Inhalt nicht zu 100% mit dem zu übersetzenden Satz überein.

Bei einer "Übereinstimmung" von unter 50 % wird generell von einem No Match gesprochen.

Gegenstand

Auch als Objekt bezeichnet.

Ein Gegenstand ist ein "beliebiger Ausschnitt aus der wahrnehmbaren oder vorstellbaren Welt" (DIN 2342).

Der reale (physische) Gegenstand, aber auch ein Zustand oder Prozess, der durch die Benennung und den Begriff beschrieben wird (vgl. auch semiotisches Dreieck).

Homograph

Eine Benennung mit unterschiedlicher Aussprache oder Betonung aber gleicher Schreibweise die für verschiedene Begriffe steht.

Beispiel: modérn (aktuell) – módern (verfaulen)

Ist die Aussprache gleich wird von einem Homonym/Polysem gesprochen.

Homonym

Als Homonym bezeichnet man eine gleich geschriebene und ausgesprochene Benennung, die für verschiedene Begriffe steht.

Dabei sind die Bedeutungen dieser Benennung so verschieden, dass sie (anders als beim Polysem) in keinem erkennbaren begrifflichen Zusammenhang mehr stehen.

Beispiel: Kiefer (eine Baumart) – Kiefer (Knochen des Kopfes)

Internationalisierung

Unter Internationalisierung versteht man die Entwicklung eines Produktes einschließlich der Dokumentation im Hinblick auf eine leichte Anpassung an andere Märkte (Sprachen und Kulturen).

Internationalisierung wird pro Produkt meist nur einmal durchgeführt.

Umgesetzt werden kann Internationalisierung zum Beispiel durch wertneutrale oder "textlose" Bilder.

Die Anpassung der Sprache an sich wird als Lokalisierung bezeichnet.

Kein Match

Der Grad der Übereinstimmung zwischen einem neu zu übersetzenden Satz und einem bereits im Translation Memory hinterlegten Satz wird als Prozentzahl ausgedrückt.

Von einem No Match wird dann gesprochen, wenn für den zu übersetzenden Satz kein Treffer im Translation Memory gefunden wurde bzw. die prozentuale Übereinstimmung unterhalb der festgelegten Trefferschwelle (Match-Quote) liegt.

Kompositum

Ein Kompositum (Plural Komposita) ist ein aus mehreren Wörtern zusammengesetztes Wort.

Beispiel: Das Wort Terminologiedatenbank besteht aus den beiden Wörtern Terminologie und Datenbank.

Konkordanzsuche

Eine Konkordanzsuche ist die Suche nach einzelnen Wörtern, Satzteilen oder ganzen Sätzen in einem Translation Memory.

Stimmen in Translation Memory vorhandene Sätze mit der Suche überein werden sie angezeigt. So kann man den Kontext sehen, in dem die gesuchten Wörter vorkommen und kann vergleichen, wie bestimmte Wörter oder Sätze in der Vergangenheit übersetzt wurden.

Kontext-Match

Auch 101%-Match genannt.

Ein Kontext-Match ist ein Match, bei dem zusätzlich zu den Eigenschaften eines normalen 100%-Matches auch der Kontext (Sätze vor und nach dem zu übersetzenden Satz) übereinstimmt.

kontrollierte Sprache

Eine kontrollierte Sprache ist eine natürliche Sprache, die nach bestimmten Regeln eingeschränkt wird.
Ziel ist es, technische Dokumentationen verständlicher und übersetzungsgerechter zu verfassen.

Beispiel: Simplified (Technical) English

Lokalisierung

Lokalisierung bezieht sich auf die Anpassung der Technischen Dokumentation an die Sprache und die kulturellen Anforderungen eines bestimmten Landes.

LSP

Akronym von Language Service Provider.

Englisch für Übersetzungs-/Sprachdienstleister.

Match

Wird in einem Translation Memory eine Suche durchführt, so wird der Inhalt und die Formatierung des aktuellen Satzes/Segments mit Sätzen/Segmenten in derselben Sprache im Translation Memory verglichen.
Ein Match ist eine vollständige oder teilweise Übereinstimmung des zu übersetzenden Satzes/Segments mit einem im Translation Memory gespeicherten Satz/Segment.
Der Grad des Matches wird als Prozentzahl ausgedrückt.

Match-Quote

Prozentzahl, die den Grad der Übereinstimmung eines Satzes/Segments mit einem im Translation Memory gespeicherten Satz/Segment angibt.

Man unterscheidet Kontext-Match, 100%-Match, Fuzzy-Match und Kein Match.

Mehrwortbenennung

Benennung, die aus mindestens zwei durch Leerstellen getrennten Wörtern besteht. (DIN 2342)

maschinelle Übersetzung

Abkürzung MÜ.

Englisch: Machine Translation (Abkürzung MT).

Im Gegensatz zur computergestützten Übersetzung (CAT) erfolgt eine maschinelle Übersetzung (MT) vollautomatisch ohne die Notwendigkeit eines Humanübersetzers.

Noise

Maßzahl einer qualitativen Termextraktion.

Extraktionstools produzieren wesentlich umfangreichere Listen, als der Mensch als Terminologe das vermutlich tun würde. Zahlreiche Wortkombinationen werden vom Extraktionstool als Termkandidaten ausgegeben, die in Wahrheit keinen terminologischen Wert haben. Zahlreiche Wortformen werden nicht als zusammengehörig erkannt. Folglich müssen diese fälschlich produzierten Vorschläge aus den Listen wieder gestrichen werden.

Normzeile

Die Normzeile ist eine in der Übersetzungsbranche übliche Größe zur Abrechnung von Übersetzungen. Eine Normzeile umfasst in Deutschland standardmäßig eine Länge von 50 - 55 Anschlägen einschließlich der Leerzeichen. 30 Normzeilen ergeben normalerweise eine Normseite.

Polysem

Als Polysem bezeichnet man eine eine gleich geschriebene und ausgesprochene Benennung, die für verschiedene Begriffe steht.

Polyseme haben mehrere Bedeutungen, die untereinander ähnlich sind (Bedeutungsvarianten). Polysemie bedeutet eine systematische Mehrdeutigkeit.

Haben die Begriffe keinen gemeinsamen Ursprung, so sind sie Homonyme. Ein Unterschied zwischen Homonym und Polysem ist oftmals schwer zu erkennen und ist für das normale Terminologiemanagement nicht relevant.

Beispiel: Nase (Körperteil) - Nase (Vorsprung)

Relais-Übersetzung

Bei einer Relais-Übersetzung wird der Ausgangstext zunächst in eine Drittsprache übersetzt, da es für die direkte Übersetzung keinen passenden Übersetzer gibt.

Bei der Relais-Übersetzung wird z. B. vom Portugiesischen ins Finnische übersetzt, indem zunächst eine Übersetzung ins Französische oder Englische - das genügend Übersetzer oder Dolmetscher beherrschen - zwischengeschaltet wird.

Semiotisches Dreieck

Das semiotische Dreieck stellt die Relation zwischen der Benennung, dem dadurch hervorgerufenen Begriff und dem damit gemeinten realen Gegenstand dar.

Silence

Maßzahl einer qualitativen Termextraktion.

Unter Silence versteht man den Umstand, dass Extraktionstools im Text enthaltene Termini nicht als Vorschläge erkennen. Die Silence sollte so gering wie möglich sein.

Standard

Auch als Vorzugsbenennung oder zugelassene Benennung bezeichnet.

Gibt es für einen Begriff mehrere synonyme Benennungen, so muss ein Standard festgelegt werden, der gegenüber den anderen Benennnungen bevorzugt wird. Alle anderen Synonyme sind Unwörter.

Bei der Dokumentenerstellung und der Übersetzung sollte immer dieser Standardterm benutzt werden.

Stoppwort

Stoppwörter sind meist nicht sinntragend und übernehmen häufig grammatikalische Funktionen im Text. Durchschnittlich handelt es sich bei zwischen 30% und 50% der Wörter eines Textes um Stoppwörter. Bei einer Termextraktion werden Stoppwörter herausgefiltert und somit nicht als Termkandidaten vorgeschlagen.

Beispiele:
Bestimmte Artikel: der, die, das
Unbestimmte Artikel: eine, einer
Bindewörter: der, und, mit
Präpositionen: bis, um, durch, an

Synonym

Zwei Ausdrücke (lexikalische Zeichen) sind genau dann synonym, wenn sie dieselbe (denotative) Bedeutung haben, also bedeutungsgleich sind.

TBX

Akronym von TermBase eXchange

XML-basiertes Format mit dem ein standardisierter Austausch von Beständen aus Terminologiedatenbanken erfolgen kann.

Term

Die Einheit aus einem Begriff und seiner Benennung.

Terminologie

Auch als Fachwortschatz bezeichnet.

Gesamtbestand der Begriffe und ihrer Benennungen in einem Fachgebiet (DIN 2342).

Terminologiedatenbank

Die Terminologie in elektronischer Form.

Sie kann als Excel-Tabelle im csv-Format, im terminologieeigenen tbx-Format oder in einem anderen speziellen Format vorliegen. So kann die Terminologie in Softwareprogramme zur Verwaltung und Anzeige eingespielt werden.

Terminologieextraktion

Auch als Termextraktion bezeichnet.

Entweder die Extraktion von Termen aus einem Text mit dem Ziel, die zielsprachlichen Entsprechungen festzulegen.

Oder die Extraktion von Termen und ihren zielsprachlichen Entsprechungen aus einem Translation Memory mit dem Ziel eine Terminologie(datenbank) aufzufüllen.

Terminologiemanagement

Auch als Terminologiearbeit bezeichnet.

Terminologiemanagement umfasst die Erarbeitung, Speicherung, Pflege und Nutzung von Fachwörtern, mit dem Ziel einer unternehmensweiten, konsistenten und effizienten Verwendung von Terminologie.

Terminologieverwaltungssystem

Auch als Terminologiemanagementsystem, Terminologietool bezeichnet.

Abkürzung: TSV.

Eine Software mit der eine Terminologie aufgebaut, dargestellt und bearbeitet werden kann. Es beinhaltet eine Terminologiedatenbank.

Thesaurus

Ein Thesaurus ist ein kontrolliertes Vokabular, dessen Begriffe durch Relationen miteinander verbunden sind (Wortnetz).

Translation Memory

Abkürzung TM.

Ein Translation Memory ist eine Datenbank zur strukturierten Speicherung von Übersetzungen. Diese Datenbank ist die Hauptkomponente von Systemen zur computergestützten Übersetzung (CAT-Tools). In einem Translation Memory werden Übersetzungen (Satzpaare) während der Arbeit kontinuierlich gespeichert, damit sie künftig für neu zu erstellende Übersetzungen wiederverwendet werden können.

Translation-Memory-System

Abkürzung TMS.

Ein Translation-Memory-System ist eine System zur computergestützten Übersetzung (CAT-Tools). In einem Translation-Memory-System werden dem Übersetzer während seiner Arbeit kontinuierlich im TM gespeicherte Übersetzungen (Satzpaare) angezeigt. Diese erleichtern dem Übersetzer seine Arbeit.

TMX

Akronym von Translation Memory eXchange

TMX ist ein XML-basiertes Format für den standardisierten Austausch von Translation Memory-Daten.

Übersetzungsmanagement

Das Übersetzungsmanagement umfasst die Verwaltung, Steuerung und Überwachung von Übersetzungsprozessen. Hierzu zählen die Einholung von Angeboten, Definition und Kontrolle von Terminen, Bereitstellung der erforderlichen Ressourcen, Verteilung aller Aufgaben an die entsprechenden Akteure, Qualitätssicherung und schließlich die Archivierung.

Unwort

Auch als abgelehnte Benennung bezeichnet.

Unwörter sind alternative Benennungen für denselben Begriff, die in der Begriffsbeschreibung identifiziert werden, jedoch aufgrund objektiver Kriterien nicht verwendet werden (DIN 2342).

Es ist wichtig solche Synonyme in den Datenbestand aufzunehmen und als Unwort zu deklarieren.

Bei der Dokumentenerstellung oder Übersetzung sollte der Einsatz von Unwörter vermieden werden.

Vorübersetzung

Eine Vorübersetzung ist ein automatisierter Vergleich eines neu zu übersetzenden Textes mit dem gespeicherten Translation Memory und der anschließenden Übernahme der Matches in den Zieltext zur Unterstützung des Übersetzers.

XLIFF

Das XML Localization Interchange File Format, abgekürzt XLIFF, ist ein XML-Format zur Darstellung hierarchisch strukturierter Daten in Übersetzungs-Tools (CAT-Tools).

Wir möchten darauf hinweisen, das wir für den Inhalt der verlinkten Seiten keine Haftung übernehmen
und keine Garantie für die Vollständigkeit dieser Seite geben können.
* Affiliatelink

Vermissen Sie ein System in unserer Auflistung oder haben Anregungen zur Ergänzung/Änderung?
Dann kontaktieren Sie uns doch einfach unter info@fritz-communication.de