Interviews transkribieren – worum geht es?
Ein Interview ist eine Methode in der empirischen Forschung, mit der nicht standardisierte, interpretierbare Daten erhoben werden. Um diese Daten nachvollziehbar auszuwerten, muss man die (zuvor aufgezeichneten) Interviews transkribieren. Als Transkription bezeichnet man dabei die Verschriftlichung von Audio- und Videoaufnahmen.
Ein Transkript ermöglicht es, ein Interview wissenschaftlich fundiert zu verwerten. Je nach Disziplin kommen dabei verschiedene Methoden zum Einsatz, etwa qualitative Inhaltsanalysen oder Gesprächsanalysen.
Wie läuft eine Transkription ab?
Forscher müssen ihre Interviews in der Regel selbst transkribieren. Zwar gibt es eine Reihe von Hilfsmitteln, die diese lästige Arbeit erleichtern sollen, es lohnt sich aber, die Methode anfangs einmal von der Pike auf zu erlernen.
Um das Interview zu transkribieren, wird der gesprochene Text der Aufzeichnung Wort für Wort aufgeschrieben. Das klingt zunächst einfach, ist aber komplexer und zeitaufwendiger als man denkt. Eine realistische Faustregel ist, dass man für die Transkription das Fünf- bis Zehnfache der Aufnahmezeit einplanen muss.
Wie hoch ist der Arbeitsaufwand?
Die Dauer der Transkription kann im Einzelfall erheblich variieren und hängt nicht nur von den Fähigkeiten des Transkribierenden ab, sondern auch maßgeblich von der Beschaffenheit der Aufnahme. Es ist einfach, technisch gelungene, klar verständliche Aufnahmen zu transkribieren, die man noch dazu visuell vor sich hat. Eine reine Tonaufnahme ist schon schwieriger. Eine rauschende Tonaufnahme einer hitzigen Gruppendiskussion, bei der sich die Sprecher kaum noch unterscheiden lassen und sich auch noch ständig ins Wort fallen, ist ein Albtraum.

Technische (und sonstige) Hilfsmittel
Theoretisch kann jeder mit Bordmitteln ein solides Transkript erstellen – ein einfaches Textverarbeitungsprogramm genügt. Allerdings gibt es mittlerweile eine Vielzahl von Softwares, die es erheblich vereinfachen, Interviews zu transkribieren. Nicht nur die kontinuierliche Verbesserung von Spracherkennungsprogrammen erleichtert dem Forscher die Arbeit.
Spezielle Transkriptionssoftwares bringen praktische Features wie automatische Zeitmessung, Loopfunktionen und verringerte Abspielgeschwindigkeit mit. Optimalerweise werden diese mit einem USB-Fußpedal kombiniert, das das Wechseln zwischen Maus und Tastatur überflüssig macht.
Große Projekte erfordern häufig eine riesige Menge von Transkripten. Universitäten greifen dafür gerne auf kleine Armeen studentischer Hilfskräfte zurück, allerdings hat nicht jeder Lehrstuhl die Mittel dafür. Es gibt auch professionelle Texterbüros, die sich auf das Erstellen von Transkripten spezialisiert haben.
Wie detailliert muss das Transkript sein?
Wie viele Einzelheiten des Interviews im Transkript festgehalten werden, hängt von der geplanten Verwendungsweise ab.
Journalistische Interviews bereinigen die gesprochene Sprache relativ stark, denn hierbei kommt es allein auf den Wortsinn an. Pausen, Versprecher und „ähms“ sind hier irrelevant.
Völlig anders ist die Herangehensweise in der Sprachwissenschaft, wo das Wie und Warum der Äußerung im Fokus stehen. Dementsprechend „holprig“ lesen sich Transkripte, die etwa die exakte Länge von Pausen, die Lautstärke einzelner Silben und die Gleichzeitigkeit von Äußerungen abbilden.
Interviews transkribieren kann also von einer Anpassung an die geschriebene Standardsprache bis hin zur phonetischen Umschrift alles bedeuten. Jede wissenschaftliche Disziplin hat ihre eigenen Transkriptionsstandards, die wiederum auf die konkrete Fragestellung angepasst werden. Grundsätzlich geht mit einer Vereinfachung des Transkripts ein gewisser Informationsverlust einher. Der Forscher sollte sich im Voraus genau überlegen, welche Erkenntnisse die Interviews liefern sollen, und die Komplexität der Transkription daraufhin anpassen.
Welche Transkriptionsregeln gibt es?
Es gibt verschiedene Transkriptionsregeln, die sich je nach Ziel und wissenschaftlichem Kontext unterscheiden. Die wichtigsten Transkriptionssysteme stammen aus der linguistischen und sozialwissenschaftlichen Forschung. Im Folgenden erhältst du einen Überblick über die gängigsten Transkriptionsregeln und -systeme:
🔹 Transkriptionssysteme: Übersicht
Transkriptionssystem | Hauptzweck | Merkmale |
---|---|---|
GAT (Gesprächsanalytisches Transkriptionssystem) | Linguistische Gesprächsanalyse | Detaillierte Darstellung von Prosodie (z. B. Pausen, Intonation) |
HIAT (Halbinterpretative Arbeitstranskriptionen) | Diskursanalyse, Ethnographie | Mitteldetailliert, strukturiert nach Redebeiträgen |
Simple Transkription (vereinfachtes Verfahren) | Qualitative Sozialforschung (z. B. Interviews) | Fokus auf Inhalt, wenig Formdetails |
IPA (International Phonetic Alphabet) | Phonetische Forschung | Lautschriftlich, sehr detailliert |
Einfache Transkription (Inhaltsorientiert)
Anwendung: In der qualitativen Forschung, z. B. bei Experteninterviews, Fokusgruppen.
Merkmale:
-
Wortgetreue Verschriftlichung
-
Keine Markierung von Betonung, Lautstärke oder Intonation
-
Dialektformen werden in Hochsprache übertragen (optional)
Beispiel:
Interviewer: Was haben Sie dann gemacht?
Befragter: Ich habe das Projekt beendet und mich neu orientiert.
Diese Art der Transkription reicht oft aus, wenn Inhaltsanalyse nach Mayring oder Themenanalyse durchgeführt wird.
Transkriptionsregeln nach Dresing & Pehl
Sehr gebräuchlich im Kontext von qualitativer Sozialforschung (z. B. bei Bachelor- oder Masterarbeiten). Diese Regeln verbinden einfache Struktur mit wissenschaftlicher Nachvollziehbarkeit.
Wichtige Regeln:
-
Wortgenaue Transkription
-
Keine Verschriftlichung von „äh“, „hm“, es sei denn, sie sind bedeutungstragend
-
Dialekt wird in Hochsprache übertragen
-
Satzzeichen zur Strukturierung
-
Nicht-verbale Kommunikation optional (z. B. [lacht])
Beispiel:
Interviewer: Und wie haben Sie darauf reagiert?
Befragte: Ich war erst mal total überrascht [lacht].
🔒 Was ChatGPT oder andere KI´s nicht direkt können:
-
Keine direkte Audioverarbeitung: Du kannst der KI keine Audiodatei hochladen und erwarten, dass sie sie transkribieren.
-
Keine automatische Sprechererkennung in Audio: Also kein Speaker 1 und 2. Diese müssen vorher festgelegt sein.