KI verändert Software-Testing auf zwei Ebenen: als Werkzeug für Testdatengenerierung, Dokumentenanalyse und Code-Reviews, und als Bedrohung für bestehende Testrollen. Tiefes Systemwissen und Domain-Expertise bleiben dabei unverzichtbar, weil KI-Agenten zwar oberflächliche Tests abdecken können, aber Seiteneffekte in gewachsenen Codebasen noch nicht zuverlässig erkennen.
Das Wichtigste in Kürze
- KI-gestützte Code-Generierung erzeugt kurzfristig Produktivitätsgewinne, wird aber mittelfristig eine Welle an größeren Refactorings und Software-Ausfällen auslösen, weil der Gesamtblick auf gewachsene Systeme fehlt.
- QA-Lead-Positionen und erfahrene Testing-Rollen werden gerade aktiv wegrationalisiert, während regulierte Branchen von diesem Stellenabbau bislang deutlich weniger betroffen sind.
- Nicht-funktionale Anforderungen wie Security, Accessibility und Performance gelten in Testing-Teams als Standard, sind aber für Produktmanagement und C-Level-Entscheider oft vollständig unbekannt.
- Systemarchitektur-Kenntnisse und Domain-Expertise sind die Skills, die Tester unersetzbar machen, weil eine KI zwar High-Level-Abdeckung liefern kann, aber kein Kontextwissen über die eigene Produktdomäne besitzt.
KI verändert das Testen, aber nicht so, wie es das Management gern hätte
Künstliche Intelligenz dominiert die Diskussion in der Tester-Community, von Konferenzbühnen bis ins lokale Werbeblatt. Beim Testen selbst kreisen die Themen vor allem um generative KI: Testdatengenerierung, das Erzeugen von Testfällen, das Zusammenfassen und Auswerten von Dokumenten.
Der nächste Schritt sind Agenten und das Model Context Protocol (MCP). Damit lässt sich aus einer API heraus eine Agentenfähigkeit aufbauen. Wer testet, sollte sich jetzt damit beschäftigen, auch ohne Druck aus der Firmenstrategie. Die Werkzeuge sind frei zugänglich, eigene Systeme lassen sich bauen und ausprobieren.
Reif für den Produktiveinsatz ist KI dort, wo viel mit Text und Dokumenten gearbeitet wird. Daniel Knott nennt aus seiner Arbeit bei der Techniker Krankenkasse die Analyse, Zusammenfassung und Auswertung von Dokumenten als Fall, in dem KI bereits Produktivanwendungen trägt. Viele andere Firmen stecken dagegen noch in der Findungsphase und bauen erste Prototypen in bestehende Produkte ein.
Testdaten und neue Sichten auf das System: hier zahlt KI für Tester ein
Testdatengenerierung ist eines der stärksten KI-Anwendungsgebiete im Testen, besonders wenn der Zugriff auf eigene Datenquellen über private LLMs abgesichert ist. Das bringt einen konkreten Mehrwert in der täglichen Arbeit.
Ein zweiter Effekt ist der veränderte Blick auf Daten. Lässt man einen Copilot oder ein anderes LLM auf eigene Repositories zugreifen, entstehen neue Insights über Datenzusammenhänge. Daraus folgen bessere Entscheidungen: Will ich auf dieser Ebene testen, oder will ich komplett automatisieren?
Die Rolle des Testers als Domain-Experte verschwindet dadurch nicht. Im Gegenteil. Wer die fachlichen Zusammenhänge kennt, kann die Ergebnisse der KI überhaupt erst bewerten. KI liefert mehr Informationen über ein System, die Einordnung bleibt menschliche Arbeit.
Eine Welle aus generiertem Code rollt an, und sie wird teuer
Vibe-Coding und KI-gestützte Entwicklung senken die Hürde, Software zu bauen, drastisch. Für junge Gründer ist das eine günstige Phase: Mit wenig Personal und wenig technischem Know-how kommt ein Produkt schneller auf die Straße.
Die Rechnung kommt später. In den nächsten Jahren ist mit einer Welle größerer Refactorings, Fehlschläge und Software-Ausfälle zu rechnen. Ein “Fix” ist schnell generiert, ein Code-Review schnell an die KI delegiert. Was fehlt, ist der Gesamtblick: ob eine geänderte Zeile in einer gewachsenen Anwendung einen Seiteneffekt auslöst.
Genau daraus entsteht neuer Bedarf. Es braucht Menschen, die ganze Systemlandschaften verstehen, durchdringen und bewerten können. Daniel geht davon aus, dass dieser Bedarf zurückkommt, sobald Unternehmen begriffen haben, was es heißt, KI sinnvoll einzusetzen, statt sie nur als Sparhebel für Personal zu benutzen.
Wir müssen jetzt leider erst durch dieses Tal der Entlassungswellen. Auf LinkedIn suchen sehr gute Leute im Testing- und im Engineering-Bereich neue Stellen. Ich glaube, dass das wieder kommt, weil die Unternehmen erst verstehen müssen, was es heißt, die KI vernünftig einzusetzen.
Daniel Knott
Die Sorge um die eigene Stelle ist real
Neben KI bewegt die Community vor allem die Unsicherheit über die eigene Zukunft. Wer täglich auf LinkedIn schaut, sieht Suchanfragen und geteilte Gesuche. KI hat momentan einen spürbaren Einfluss auf Stellen im Testen.
Besonders fehlen erfahrene Positionen. QA-Lead-Stellen und Rollen Richtung Testing-Management oder General-Management sind derzeit kaum zu finden. Solche Aufgaben werden wegrationalisiert oder jemand anderem mit aufgebürdet.
Der Druck kommt dabei nicht allein von KI. Die Wirtschaftslage und eine alte Management-Denke wirken zusammen. Auf C-Level fehlt oft der tiefe Einblick, und dann wird schnell beim Testen der Rotstift angesetzt. Den Mehrwert von Testen Richtung Business zu kommunizieren, ist eine alte Aufgabe der Community, die in solchen Momenten aber selten in der Hand des Einzelnen liegt.
Regional gibt es Unterschiede. In regulierten Umgebungen ist der Einschlag bislang geringer als in SaaS-Anwendungen und Startups. Im deutschsprachigen Raum fehlt die Hire-and-Fire-Mentalität, die in den USA stärker ausgeprägt ist. Eine Garantie für die Zukunft ist das nicht.
Low-Code und No-Code bleiben, weil Testwissen fehlt
Der Trend zu Low-Code- und No-Code-Automatisierungstools hält an. Firmen greifen darauf zurück, weil ihnen das Testing-Know-how fehlt. Statt einer eigenständigen Rolle als Test-Automation-Engineer ersetzt das Werkzeug die Lücke.
Parallel dazu schauen Teams fokussierter darauf, auf welchen Ebenen sie überhaupt automatisieren wollen. Produkte sind komplexer geworden: viel Backend-Code, große Schnittstellen, mehrere Frontends, dazu teils Desktop und Embedded.
Daraus folgt ein Umbau der Automatisierungsstrategie. UI-getriebene Tests mit Cypress oder Selenium sind wichtig, in der Ausführung aber teuer. Gestandene Test-Suites werden größer refactored, um die Strategie entlang der klassischen Pyramide neu zu strukturieren und den Mehrwert wieder herauszuholen.
Test-Pyramide und Agile Testing Quadrants öffnen die Kommunikation
In vielen Unternehmen fehlt schlicht das Gespräch zwischen den Beteiligten. Entwickler machen ihre Unit- und kleinen Integrationstests, eine Testabteilung macht irgendwo Oberflächenautomatisierung, oft auch für Dinge, die auf tieferen Ebenen längst abgedeckt wären.
Zwei Modelle helfen, diese Lücke zu schließen. Die Test-Pyramide eignet sich für das Gespräch mit Entwicklern darüber, auf welchen Ebenen Code automatisiert wird. Die Agile Testing Quadrants bringen nicht-funktionale Anforderungen, Akzeptanzkriterien, Performance und Observability ins Bild und damit einen ganzheitlichen Blick auf Qualität.
Daniel setzt beide Modelle im Software-Testing-Training für ein Produkt-Bootcamp ein, vor Teilnehmern ohne Testing-Hintergrund. Die Rückmeldung aus den Firmen: Die Modelle helfen vor allem, weil sie die Kommunikation überhaupt starten. Wenn das gelingt, ist viel gewonnen.
Qualität gehört ins Team, nicht in eine eigene Abteilung
Wer testet, sollte tief im Produktteam und im Produktlebenszyklus verankert sein. Nur so baut sich über die Zeit die fachliche und Domain-Expertise auf, die nötig ist, um in die Tiefe eines Systems vorzudringen.
Das hat Konsequenzen für die Skill-Frage. Breites, oberflächliches High-Level-Testen kann künftig eine KI abdecken. Agenten-Tools sind hier noch nicht perfekt, decken einfache High-Level-Themen aber bereits gut ab. Das ist kein Verlust, sondern eine Entlastung des Teams.
Die spannende Spannung bleibt: Mehr ganzheitliche Verantwortung im Team macht jeden breiter, aber niemanden mehr tief. Genau deshalb spricht vieles dafür, Test-Expertise wieder bewusst im Team zu halten, statt sie auf alle zu verteilen, bis sie verschwindet.
Welche Skills jenseits von KI tragen
Pauschale Antworten greifen zu kurz, weil jeder an einem anderen Punkt steht. Für Einsteiger gilt: Grundlagen über Bücher, Blogs und YouTube aufbauen, ruhig auch eine Zertifizierung machen, um die Begriffswelt des Testens zu kennen.
Darüber hinaus lohnen sich vor allem diese Felder:
- Systemarchitektur und Systemmodellierung. Moderne Anwendungen sind nicht mehr nur Backend, Frontend und eine Schnittstelle. Cloud-Systeme und verschachtelte Landschaften gehören dazu. Wer sie versteht, stellt als Tester gezieltere Fragen.
- Industrie- und Business-Knowledge. Es ist die Basis, um KI-Ergebnisse zu bewerten. KIs halluzinieren oft, viel und überzeugend, manchmal so gut, dass man es nicht bemerkt.
- Nicht-funktionale Anforderungen. Für Tester ein alter Hut, in Produktteams oft nicht. Auf die Frage, wann zuletzt über nicht-funktionale Anforderungen gesprochen wurde, folgen häufig leere Gesichter.
- Security und Accessibility. Auch ohne Expertenstatus lässt sich hier einlesen, ausprobieren, Neues verproben. Das Feld ist unerschöpflich.
Der wichtigste Skill ist die Haltung dahinter. Nicht auf dem Foundation Level sitzen bleiben, sondern in einem Modus aus Weiterentwicklung und Life-Long-Learning bleiben, mit Maß. Man kann sich an der Flut neuer Themen leicht überfordern und stressen. Ein gewisser Flow trägt weiter als Panik.
Die Zyklen werden schneller, und neues Terrain belohnt Neugier
Die Mobile-Welle galt um 2010 als schnell: iPhone 2007, erste App-Stores 2009, dann der Schub um 2010 bis 2012. KI ist noch schneller über die Branche gekommen. Rechenpower auf mobilen und Desktop-Geräten treibt die Zyklen weiter an.
In solchen Phasen gibt es noch keinen Standard. Bei KI tauchen neue Qualitätskriterien auf, für die es weder Bücher noch etablierte Verfahren gibt. Es bleibt nur ausprobieren, bis sich ein Standard herausbildet.
Genau das ist die Chance. Wer in einer Firma die Zeit bekommt, sich in ein neues Forschungsthema einzugraben, hat eine seltene Gelegenheit, vergleichbar mit Jugend forscht. Daniel führt seinen eigenen Weg darauf zurück: Das Wissen aus der frühen Mobile-Zeit durfte er teilen, daraus entstanden Buch und YouTube-Kanal. Die Testing-Community lebt von dieser Kultur des Teilens und Unterstützens, und genau das treibt sie voran.


