Übersetzer übersetzen Texte mit Unterstützung von Translation-Memory-Systemen. Diese Systeme speichern bereits übersetzte Sätze - meist "Segmente" genannt - zweisprachig ab. Diese Sätze werden dem Übersetzer wieder vorgeschlagen, sobald diese im selben oder in einem neuen Dokument wieder auftauchen.
Der Grad der Übereinstimmung zwischen einem neu zu übersetzenden Satz und einem bereits im Translation Memory gespeicherten Satz wird als Prozentzahl ausgedrückt.
Stimmen ein neu zu übersetzender Satz und ein bereits im Translation Memory gespeicherter Satz - in Inhalt und Formatierung - exakt überein, so handelt es sich um ein 100%-Match.
Der Grad der Übereinstimmung zwischen einem neu zu übersetzenden Satz und einem bereits im Translation Memory hinterlegten Satz wird als Prozentzahl ausgedrückt.
Stimmen ein neu zu übersetzender Satz und ein bereits im Translation Memory gespeicherter Satz - in Inhalt und Formatierung - exakt überein, so handelt es sich um ein 100%-Match.
Im Translation Memory können prozentuale Abzüge aufgrund von Unterschieden in Inhalt oder Formatierung festgelegt werden. So kann beispielsweise ein Abzug individuell festgelegt werden, wenn die Formatierung des im Translation Memory hinterlegten Satzes von der Formatierung im neu zu übersetzenden Satz abweicht.
Ein Match mit einer Übereinstimmung unterhalb von 100% wird als Fuzzy-Match bezeichnet.
Mit einem Alignment-Tool kann der Inhalt eines Translation-Memory-Systems erarbeitet werden. Das Alignment-Tool ermöglicht es, Satzpaare aus vorhandenen Übersetzungen zu bilden.
Hierbei werden Ausgangstext und Übersetzung in Segmente (Satzpaare) eingeteilt. Jedem quellsprachlichen Segment wird das entsprechende zielsprachliche Segment zugeordnet. Diese können dann in ein Translation Memory importiert werden.
Der Begriff bezeichnet eine "Denkeinheit, die aus einer Menge von Gegenständen unter Ermittlung der diesen Gegenständen gemeinsamen Eigenschaften mittels Abstraktion gebildet wird" (DIN 2342).
Begriffsorientiert bedeutet, dass in einem Datensatz nicht von einem Wort ausgegangen wird, das in diesem Datensatz mit allen seinen möglichen Bedeutungen behandelt wird, sondern jeder Bedeutung eines Wortes (jedem Begriff, jedem gedanklichen Konzept) ein eigener Datensatz gewidmet wird.
In einer begriffsorientierten Datenbank wird also für jeden Begriff ein eigener Datensatz angelegt. Dies erleichtert vorallem die Suche nach Synonymen und äquivalenten Übersetzungen, da alle Benennungen für ein gedankliches Konstrukt in einem Datensatz (Terminologieeintrag) zusammengefasst sind.
Terminologiedatenbanken sollten bevorzugt begriffsorientiert aufgebaut sei.
Auch Term, Terminus, Fachwort oder Fachausdruck genannt.
Eine Benennug ist eine "sprachliche Bezeichnung eines Allgemeinbegriffs aus einem Fachgebiet" (DIN 2342).
Die Benennung hat die Aufgabe, den Begriff sprachlich oder schriftlich zu bezeichnen. Sie kann aus einem oder mehreren Wörtern, aber auch aus Symbolen bestehen und verleiht dem Gegenstand dadurch einen Namen.
Jedes gedruckte Wort in einem Buch ist beispielsweise eine Benennung. In jeder Sprache ist die Benennung daher anders, wohingegen der Begriff (das Gedankenkonstrukt) über Landesgrenzen hinweg gleich bleibt.
Benennungsorientiert bedeutet, dass in einem Datensatz von einem Wort (Benennung) ausgegangen wird, das in diesem Eintrag mit allen seinen möglichen Bedeutungen behandelt wird.
Homonyme würden in einer benennungsorientierten Datenbank also in einen einzigen Terminologieeintrag eingetragen werden.
Wörterbücher können beispielsweise benennungsorientiert aufgebaut sein.
Akronym CAT (von Computer Aided Translation).
Der Mensch übersetzt, der Computer unterstützt ihn dabei durch ein automatisiertes Nachschlagen von Terminologie und ein automatisiertes Vergleichen aktuell zu übersetzender Texte mit früheren Übersetzungen (Translation Memory).
Im Gegensatz zur maschinellen Übersetzung (MT, MÜ) übersetzen Programme zur computergestützten Übersetzung (CAT-Tools) nicht selbst, sondern unterstützen den Humanübersetzer bei seiner Arbeit.
Von Computer Aided Translation.
Auch als Übersetzungssoftware, Übersetzungs-Tool oder CAT-Tool bezeichnet.
CAT-Programme bestehen meist aus folgenden Teilsystemen:
Es gibt unterschiedliche Vorgehensweisen bei der Termextraktion:
Statistisches Extraktionsverfahren
Eine statistische Extraktion erfolgt mit Hilfe eines Softwareprogramms. Bei einsprachigen Texten entscheidet wie häufig ein Fachwort in der Datengrundlage vorkommt darüber, ob es extrahiert wird. Bei mehrsprachigen Datenquellen werden die strukturelle Ähnlichkeit und statistische Verfahren zur Berechnung der Wahrscheinlich der Korrelation zweier Wörter verwendet. Je größer also die Textgrundlage ist, desto besser können statistische Programme arbeiten.
Linguistisches Extraktionsverfahren
Extraktionsprogramme mit einem linguistischen Ansatz haben ein enormes einzelsprachiges Wissen (z. B. über Wortbildungsregeln und Grammatik) hinterlegt und werden daher nur für einzelne Sprachen (zurzeit vor allem für Deutsch und Englisch) angeboten.
Manuelle Extraktion
Wie der Name schon sagt, extrahiert hier ein Mensch per Hand die Terminologie. Eine manuelle Extraktion ist sehr zeitaufwändig, liefert jedoch ein genaues Ergebnis, da der Mensch Mehrwortkombinationen und Grundformen erkennt und auch mit den speziellen Fachwörtern einer Branche Erfahrung hat.
Halbautomatische Termextraktion
Bei der halbautomatischen Termextraktion werden Termkandidaten von einem entsprechenden Programm extrahiert, die dann in einem weiteren Schritt von einem Terminologen überprüft und ausgewählt werden müssen.
Automatische Termextraktion
Bei der automatischen Termextraktion entfällt der Schritt der Auswahl durch einen Terminologen, da der Computer selbst eine Überprüfung und Gewichtung der Termkandidaten vornimmt.
Der Grad der Übereinstimmung zwischen einem neu zu übersetzenden Satz und einem bereits im Translation Memory hinterlegten Satz wird als Prozentzahl ausgedrückt.
Ein Suchtreffer im Translation Memory, der standardmäßig eine Match-Quote von 50-99 % aufweist wird als Fuzzy-Match bezeichnet. Der bereits im Translation Memory hinterlegte Satz stimmt in Form und Inhalt nicht zu 100% mit dem zu übersetzenden Satz überein.
Bei einer "Übereinstimmung" von unter 50 % wird generell von einem No Match gesprochen.
Auch als Objekt bezeichnet.
Ein Gegenstand ist ein "beliebiger Ausschnitt aus der wahrnehmbaren oder vorstellbaren Welt" (DIN 2342).
Der reale (physische) Gegenstand, aber auch ein Zustand oder Prozess, der durch die Benennung und den Begriff beschrieben wird (vgl. auch semiotisches Dreieck).
Als Homonym bezeichnet man eine gleich geschriebene und ausgesprochene Benennung, die für verschiedene Begriffe steht.
Dabei sind die Bedeutungen dieser Benennung so verschieden, dass sie (anders als beim Polysem) in keinem erkennbaren begrifflichen Zusammenhang mehr stehen.
Beispiel:
Kiefer (eine Baumart) ↔ Kiefer (Knochen des Kopfes)
Eine Benennung mit unterschiedlicher Aussprache oder Betonung aber gleicher Schreibweise die für verschiedene Begriffe steht.
Beispiel:
modern (aktuell) ↔ modern (verfaulen)
Ist die Aussprache gleich wird von einem Homonym/Polysem gesprochen.
Unter Internationalisierung versteht man die Entwicklung eines Produktes einschließlich der Dokumentation im Hinblick auf eine leichte Anpassung an andere Märkte (Sprachen und Kulturen).
Internationalisierung wird pro Produkt meist nur einmal durchgeführt.
Umgesetzt werden kann Internationalisierung zum Beispiel durch wertneutrale oder "textlose" Bilder.
Die Anpassung der Sprache an sich wird als Lokalisierung bezeichnet.
Auch No Match genannt.
Der Grad der Übereinstimmung zwischen einem neu zu übersetzenden Satz und einem bereits im Translation Memory hinterlegten Satz wird als Prozentzahl ausgedrückt.
Von einem No Match wird dann gesprochen, wenn für den zu übersetzenden Satz kein Treffer im Translation Memory gefunden wurde bzw. die prozentuale Übereinstimmung unterhalb der festgelegten Trefferschwelle (Match-Quote) liegt.
Ein Kompositum (Plural Komposita) ist ein aus mehreren Wörtern zusammengesetztes Wort.
Beispiel:
Das Wort Terminologiedatenbank besteht aus den beiden Wörtern Terminologie und Datenbank.
Eine Konkordanzsuche ist die Suche nach einzelnen Wörtern, Satzteilen oder ganzen Sätzen in einem Translation Memory.
Stimmen in Translation Memory vorhandene Sätze mit der Suche überein werden sie angezeigt. So kann man den Kontext sehen, in dem die gesuchten Wörter vorkommen und kann vergleichen, wie bestimmte Wörter oder Sätze in der Vergangenheit übersetzt wurden.
Auch 101%-Match genannt.
Ein Kontext-Match ist ein Match, bei dem zusätzlich zu den Eigenschaften eines normalen 100%-Matches auch der Kontext (Sätze vor und nach dem zu übersetzenden Satz) übereinstimmt.
Eine kontrollierte Sprache ist eine natürliche Sprache, die nach bestimmten Regeln eingeschränkt wird.
Ziel ist es, technische Dokumentationen verständlicher und übersetzungsgerechter zu verfassen.
Beispiel:
Simplified (Technical) English
Wird in einem Translation Memory eine Suche durchführt, so wird der Inhalt und die Formatierung des aktuellen Satzes/Segments mit Sätzen/Segmenten in derselben Sprache im Translation Memory verglichen.
Ein Match ist eine vollständige oder teilweise Übereinstimmung des zu übersetzenden Satzes/Segments mit einem im Translation Memory gespeicherten Satz/Segment.
Der Grad des Matches wird als Prozentzahl ausgedrückt.
Prozentzahl, die den Grad der Übereinstimmung eines Satzes/Segments mit einem im Translation Memory gespeicherten Satz/Segment angibt.
Man unterscheidet Kontext-Match, 100%-Match, Fuzzy-Match und Kein Match.
Abkürzung MÜ
Englisch: Machine Translation (Abkürzung MT)
Im Gegensatz zur computergestützten Übersetzung (CAT) erfolgt eine maschinelle Übersetzung (MÜ) vollautomatisch ohne die Notwendigkeit eines Humanübersetzers.
Maßzahl einer qualitativen Termextraktion.
Extraktionstools produzieren wesentlich umfangreichere Listen, als der Mensch als Terminologe das vermutlich tun würde. Zahlreiche Wortkombinationen werden vom Extraktionstool als Termkandidaten ausgegeben, die in Wahrheit keinen terminologischen Wert haben. Zahlreiche Wortformen werden nicht als zusammengehörig erkannt. Folglich müssen diese fälschlich produzierten Vorschläge aus den Listen wieder gestrichen werden.
Die Normzeile ist eine in der Übersetzungsbranche übliche Größe zur Abrechnung von Übersetzungen.
Eine Normzeile umfasst in Deutschland standardmäßig eine Länge von 50 - 55 Anschlägen einschließlich der Leerzeichen.
30 Normzeilen ergeben normalerweise eine Normseite.
Als Polysem bezeichnet man eine eine gleich geschriebene und ausgesprochene Benennung, die für verschiedene Begriffe steht.
Polyseme haben mehrere Bedeutungen, die untereinander ähnlich sind (Bedeutungsvarianten). Polysemie bedeutet eine systematische Mehrdeutigkeit.
Haben die Begriffe keinen gemeinsamen Ursprung, so sind sie Homonyme. Ein Unterschied zwischen Homonym und Polysem ist oftmals schwer zu erkennen und ist für das normale Terminologiemanagement nicht relevant.
Beispiel:
Nase (Körperteil) ↔ Nase (Vorsprung)
Bei einer Relais-Übersetzung wird der Ausgangstext zunächst in eine Drittsprache übersetzt, da es für die direkte Übersetzung keinen passenden Übersetzer gibt.
Bei der Relais-Übersetzung wird z. B. vom Portugiesischen ins Finnische übersetzt, indem zunächst eine Übersetzung ins Französische oder Englische - das genügend Übersetzer oder Dolmetscher beherrschen - zwischengeschaltet wird.
Auch als Translation Memory bezeichnet.
Abkürzung TM
Ein Satzarchiv ist eine Datenbank zur strukturierten Speicherung von Übersetzungen. Diese Datenbank ist die Hauptkomponente von Systemen zur computergestützten Übersetzung (CAT-Tools). In einem Satzarchiv werden Übersetzungen (Satzpaare) während der Arbeit kontinuierlich gespeichert, damit sie künftig für neu zu erstellende Übersetzungen wiederverwendet werden können.
Maßzahl einer qualitativen Termextraktion.
Unter Silence versteht man den Umstand, dass Extraktionstools im Text enthaltene Termini nicht als Vorschläge erkennen.
Die Silence sollte so gering wie möglich sein.
Auch Controlled Language Checker, Autorenunterstützung oder Sprachprüfwerkzeug genannt.
Sprachprüfprogramme überprüfen die Einhaltung von Terminologie- und Stilregeln beim Verfassen von Text. Sie unterstützen hierdurch den Technischen Redakteur beim Schreiben in kontrollierter Sprache, indem sie z.B. Dokumente auf die Einhaltung firmenintern festgelegter Fachbegriffe (Terminologie) überprüfen.
Grundsätzlich existieren zwei unterschiedliche Arten von Sprachprüfprogrammen:
nicht linguistische, die vorwiegend auf dem Fuzzy-Match-Verfahren basieren und
linguistische, die zusätzlich über ein enormes sprachliches Know-How verfügen.
Auch als Vorzugsbenennung oder zugelassene Benennung bezeichnet.
Gibt es für einen Begriff mehrere synonyme Benennungen, so muss ein Standard festgelegt werden, der gegenüber den anderen Benennnungen bevorzugt wird. Alle anderen Synonyme sind Unwörter.
Bei der Dokumentenerstellung und der Übersetzung sollte immer dieser Standardterm benutzt werden.
Stoppwörter sind meist nicht sinntragend und übernehmen häufig grammatikalische Funktionen im Text. Durchschnittlich handelt es sich bei zwischen 30% und 50% der Wörter eines Textes um Stoppwörter. Bei einer Termextraktion werden Stoppwörter herausgefiltert und somit nicht als Termkandidaten vorgeschlagen.
Beispiele:
Extrahierte Terminologie ist sprachlich nicht aufbereitet.
Um die Terme jedoch aktiv im Unternehmen nutzen zu können (und in der Terminologiedatenbank nutzbar zu hinterlegen), müssen sie in eine einheitliche Form gebracht werden.
Die extrahierten Terme werden anhang von allgemeingültigen und normenkonformen Regeln bereinigt.
Solche Regeln enthalten z. B. Angaben zur Schreibweise oder zur Kompositabildung.
Auch als Terminologiemanagementsystem, Terminologieverwaltungssystem, Terminologietool bezeichnet.
Abkürzung: TD, TSV
Die Terminologie in elektronischer Form. Meist eine Software mit der eine Terminologie aufgebaut, dargestellt und bearbeitet, also verwaltet werden kann.
Die Terminologie an sich kann dann z. B. als Excel-Tabelle im csv-Format, im terminologieeigenen tbx-Format oder in einem anderen speziellen Format aus der Terminologiedatenbank exportiert werden.
Auch als Termextraktion bezeichnet.
Bei einer Termextraktion werden aus bestehenden Technischen Dokumenten (oder auch anderen relevanten Dokumenten) Fachwörter (Terminologie) extrahiert, die Sie dann unternehmensweit einsetzen können (z. B. für die Textverarbeitung, in Redaktionssystemen oder Übersetzungsprogrammen).
Die extrahierte Terminologie kann in Terminologiedatenbanken gespeichert werden.
Meistens erfolgt eine Extraktion immer zuerst in der Sprache in der die Originaldokumente erstellt werden (häufig Deutsch). Später können dann alle relevanten Fremdsprachen aus den Übersetzungen (z. B. aus einem Translation Memory) extrahiert werden.
siehe auch: Extraktionsverfahren
Ein Terminologieleitfaden enthält Regeln zur Terminologiebildung und -schreibweise und ermöglicht eine präzise und konsistente Terminologie über alle Dokumente, Abteilungen, Standorte und Sprachen hinweg.
Beispiele für sprachlichen Regeln zur Terminologiebildung sind: Wie werden Komposita gebildet? Wann schreibt man Benennungen mit oder ohne Bindestrich? Wie geht man mit Fugen um?
Das primäre Ziel eines Terminologieleitfadens ist die Etablierung einer kontrollierten Sprache in Unternehmen, wodurch die Textqualität verbessert, die Redaktions- und Übersetzungskosten reduziert und der Wissenstransfer als auch die digitale Weiterverarbeitung verbessert werden.
Der Terminologieleitfaden kann beispielsweise ein Bestandteil des Redaktions- oder Übersetzungsleitfaden sein oder als Leitfaden für die Erfassung und Pflege von Stammdaten dienen.
Des Weiteren existieren Sprachprüfprogramme, welche die Einhaltung der Regeln des Terminologieleitfadens automatisch prüfen.
Auch als Terminologiearbeit bezeichnet.
Terminologiemanagement umfasst die Erarbeitung, Speicherung, Pflege und Nutzung von Fachwörtern, mit dem Ziel einer unternehmensweiten, konsistenten und effizienten Verwendung von Terminologie.
Abkürzung: TMS
Ein Translation-Memory-System ist ein System zur computergestützten Übersetzung (CAT-Programm). In einem Translation-Memory-System werden dem Übersetzer während seiner Arbeit kontinuierlich im TM gespeicherte Übersetzungen (Satzpaare) angezeigt. Diese unterstützen und erleichtern die Arbeit der Übersetzer.
Das Übersetzungsmanagement umfasst die Verwaltung, Steuerung und Überwachung von Übersetzungsprozessen. Hierzu zählen die Einholung von Angeboten, Definition und Kontrolle von Terminen, Bereitstellung der erforderlichen Ressourcen, Verteilung aller Aufgaben an die entsprechenden Akteure, Qualitätssicherung und schließlich die Archivierung.
Auch als abgelehnte Benennung bezeichnet.
Unwörter sind alternative Benennungen für denselben Begriff, die in der Begriffsbeschreibung identifiziert werden, jedoch aufgrund objektiver Kriterien nicht verwendet werden (DIN 2342).
Es ist wichtig solche Synonyme in den Datenbestand aufzunehmen und als Unwort zu deklarieren.
Bei der Dokumentenerstellung oder Übersetzung sollte der Einsatz von Unwörter vermieden werden.
Eine Vorübersetzung ist ein automatisierter Vergleich eines neu zu übersetzenden Textes mit dem gespeicherten Translation Memory und der anschließenden Übernahme der Matches in den Zieltext zur Unterstützung des Übersetzers.
Akronym für XML Localization Interchange File Format
Ein XML-Format zur Darstellung hierarchisch strukturierter Daten in Übersetzungs-Tools (CAT-Tools).
Die mit Sternchen (*) gekennzeichneten Links sind sogenannte Affiliatelinks. Wenn Sie auf solch einen Affiliatelink klicken und über diesen Link einkaufen, bekommt Fritz Communication von dem betreffenden Online-Shop oder Anbieter eine Provision. Für Sie verändert sich der Preis nicht.
Diese Website benutzt Cookies. Wenn du die Website weiter nutzt, gehen wir von deinem Einverständnis aus.OKNein
Du kannst deine Zustimmung jederzeit widerrufen, indem du den den Button „Zustimmung widerrufen“ klickst.Zustimmung wiederrufen