“Wir haben leider beim Audio das Problem, dass die Datenmengen ungleich größer sind. Deswegen gibts da auch noch nicht so coole Modelle wie jetzt von OpenAI ChatGPT oder sowas” – Olaf Thiele
Olaf ist Experte für Audio-KIs. Dabei gibt es eine Menge Herausforderungen, gerade im deutschsprachigen Raum: Sehr viele unterschiedliche Dialekte und die dazu notwendigen – aber oft fehlenden – Trainingsdaten. Er nimmt uns mit in die Welt der Sprach-KIs, wie wir diese trainieren und testen können und welche Aufgaben er eigentlich ChatGPT stellt.
Olaf digitalisiert gesprochenes Deutsch. Er trainiert Modelle für die Transkription und Synthese von deutschem Audiomaterial mit Hilfe von künstlicher Intelligenz. Da diese Modelle immer stärker genutzt werden, wird auch das Testen und die Qualitätssicherung dieser Modelle immer wichtiger.
Themen im Podcast:
- Herausforderungen beim Testen von Audio
- Der goldene Testsatz
- Berücksichtigung verschiedener Dialekte
- Das Problem der Datenbeschaffung für deutsche Sprache und ihre Dialekte
- Synthetisieren von Sprache
- Wie ChatGPT Olaf und seinen Kollegen hilft
Kontakt zu Olaf: