Ergebnisse der Softwaretest-Umfrage 2024

Die Software-Testumfrage 2024 ist eine branchenweite Erhebung zum Status quo des Softwaretestens in deutschsprachigen Unternehmen, die seit 2011 alle vier bis fünf Jahre durchgeführt wird. Rund 800 Teilnehmende aus Entwicklung, Test und Management antworteten. Kernbefunde: Ein Drittel nutzt bereits KI für Codierung und Qualitätssicherung, während grundlegende Testverfahren wie Äquivalenzklassenbildung und Sicherheitstests deutlich zu selten eingesetzt werden.

Das Wichtigste in Kürze

Ein Drittel der befragten Testerinnen und Tester nutzt KI bereits für Kodierung und deren Qualitätssicherung, bei der Programmierung allein sind es fast 50 Prozent der operativ Tätigen.
Testverfahren wie Äquivalenzklassenbildung und Grenzwertanalyse werden nur von rund 40 Prozent der Befragten genutzt, obwohl ISTQB-Zertifizierungen seit über 20 Jahren diese Grundlagen vermitteln.
12 Prozent der Teilnehmer automatisieren den Regressionstest bis heute nicht, ein Viertel verzichtet sogar bei Last- und Performance-Tests auf Automatisierung.
Testgetriebene Entwicklung verliert seit Jahren kontinuierlich an Verbreitung: von 67 Prozent im Jahr 2016 auf 48 Prozent im Jahr 2024, obwohl agile Vorgehensmodelle gleichzeitig zunehmen.
Zwei Drittel der operativ Tätigen sehen erhöhten Weiterbildungsbedarf in IT-Security, schätzen sich aber gleichzeitig als gut vorbereitet ein, was eine klare Selbstwahrnehmungslücke zeigt.

Die Software-Testumfrage liefert seit 2011 belastbare Trends statt Bauchgefühl

Die Software-Testumfrage des German Testing Board erhebt den Status quo des Testens im deutschsprachigen Raum: was Teams tatsächlich tun, wo die Herausforderungen liegen und welche Veränderungen sich über die Jahre abzeichnen. Sie läuft seit 2011 in regelmäßigen Abständen, mit Editionen 2011, 2016, 2020 und 2024. Damit deckt sie inzwischen fast 15 Jahre ab.

Die Umfrage 2024 basiert auf über 800 Teilnehmern. Das ist eine statistisch tragfähige Größe, auch wenn die Tiefenanalyse an manchen Stellen an Grenzen stößt: Wenn viele Einzelfragen mit weiteren Kategorien korreliert werden, sinkt die Zahl der Antworten pro Schnittmenge, und man kann eher Trends ablesen als harte Aussagen treffen.

Die Auswertung läuft wissenschaftlich begleitet. Statt einer schnellen LinkedIn-Umfrage stehen Nullhypothesen, Korrelationen und ein mehrere hundert Seiten starker Technical Report dahinter. Für unterschiedliche Lesebedürfnisse gibt es drei Ergebnistüren: ein Management Summary, eine Broschüre und den vollständigen Technical Report.

Warum drei Fragebögen mehr zeigen als einer

Die Umfrage trennt nach Rollen, und genau diese Trennung macht viele Ergebnisse erst aussagekräftig. Es gibt einen Fragebogen für Manager der Qualitätssicherung, einen für operativ Tätige und einen weiteren. So lassen sich Sichtweisen direkt gegeneinander stellen.

Beim Thema Delegation zeigt sich der Unterschied deutlich. Manager neigen dazu, möglichst viel auslagern zu wollen. Operativ Tätige differenzieren stärker: Technische Aufgaben wie Testautomatisierung würden sie eher abgeben, bei weicheren Disziplinen wie Architektur- oder Security-Management stehen sie der Delegation an Externe kritisch gegenüber.

Die Teilnehmer streuen breit über Branchen und Unternehmensgrößen. Schwerpunkte liegen im Finanzbereich, im öffentlichen Dienst und in der Automotive-Branche, vergleichbar mit den Bitkom-Zahlen. Vertreten sind sowohl Konzerne mit über tausend Mitarbeitern als auch kleine Firmen mit 10 bis 20 Beschäftigten.

KI ist im Coding angekommen, im Testen noch zurückhaltend

2024 wurde KI erstmals abgefragt, und das Ergebnis ist klar: Ein Drittel der Teilnehmer nutzt heute bereits KI für Codierung und deren Qualitätssicherung. Das ist eine bemerkenswerte Durchdringung, gemessen daran, dass die breite Verfügbarkeit generativer Tools erst rund zweieinhalb Jahre zurückliegt.

In der Programmierung selbst sind die Werte am höchsten. Fast 50 Prozent der operativ Tätigen setzen KI dort bereits ein oder planen den Einsatz in naher Zukunft. Für die Aufgaben im Testen fallen die Zahlen deutlich niedriger aus.

Es gilt eine Faustregel: Je technischer eine Tätigkeit, desto mehr traut man der KI zu. Bei Designentscheidungen, Projekt- und Testmanagement, also den eher menschlichen Faktoren, nehmen die Werte signifikant ab.

Für die berufliche Orientierung hat das Folgen. Reines Entwickeln dürfte als alleiniges Profil dünner werden. Wer dagegen die Rolle des Architekten einnimmt, der Komponenten zusammenspielen lässt und Schnittstellen zwischen Menschen verhandelt, investiert in die richtige Richtung.

Wer mit KI arbeitet und nicht weiß, was Whitebox ist, nicht weiß, was eine Äquivalenzklasse ist: wie soll ich bewerten, dass das, was die KI mir generiert, einigermaßen sinnvoll ist? Frank Simon

Testautomatisierung stagniert seit 2020

Bei der Testautomatisierung bewegt sich seit Jahren wenig, und das ist der wunde Punkt der aktuellen Erhebung. Von 2011 bis 2020 stieg die Automatisierung an, seit 2020 stagniert sie. Sie bleibt in den unteren Teststufen verankert.

Die Zahlen zum Regressionstest sind ernüchternd. 12 Prozent der Teilnehmer geben an, den Regressionstest überhaupt nicht zu automatisieren, obwohl gerade dieser Test sich für Automatisierung anbietet.

Noch drastischer fällt der Last- und Performancetest aus. Ein Viertel der Befragten automatisiert ihn nicht. Ein manuell durchgeführter Lasttest ist schwer vorstellbar, weshalb hier vermutlich ein Wahrnehmungsproblem mitspielt: In agilen Projekten mit CI/CD-Pipeline taucht Last und Performance oft nicht im täglichen Ablauf auf, sondern wird in übergeordneten Gruppen behandelt und vom einzelnen Tester gar nicht gesehen.

End-to-End-Testautomatisierung wird auf Tagungen und in Unternehmen breit diskutiert. In den Zahlen schlägt sich das nicht nieder. Dort passiert auffallend wenig.

Beim Sicherheitstest klaffen Selbstbild und Realität auseinander

Die größte Diskrepanz zeigt sich im Sicherheits- sowie im Last- und Performancetest. Tester halten ihre Arbeit dort für effektiv, wissen aber zugleich, dass Kunden am Ende sehr wohl Sicherheitsprobleme haben. Diese Lücke ist auf Dauer unhaltbar.

Der Sicherheitstest gehört insgesamt zu den am dünnsten angegebenen Tests. Das hängt mit fehlendem Grundlagenwissen zusammen: 12 Prozent der Befragten geben an, nicht zu wissen, was ein Whitebox-Test ist. Ein echter Sicherheitstest ist technisch anspruchsvoll, und wer das Whitebox-Artefakt nicht kennt, hat mit ihm vermutlich wenig zu tun.

Immerhin erkennen viele die eigene Lücke. 66 Prozent der operativ Tätigen geben einen erhöhten Weiterbildungsbedarf in IT-Security an, ein Drittel auch im Last- und Performancetest. Die Selbsteinschätzung stimmt: Bevor man bewerten kann, was Werkzeuge und KI produzieren, braucht es Substanzwissen.

Testverfahren geraten zunehmend in Vergessenheit

Die klassischen Testverfahren werden seltener genutzt, statt häufiger. Grenzwertanalyse und Äquivalenzklassenbildung liegen bei knapp 40 Prozent, obwohl gerade die Äquivalenzanalyse zu den intuitivsten Verfahren überhaupt zählt. Einen Fortschritt gibt es nicht.

Das überrascht vor dem Hintergrund von über 20 Jahren Zertifizierung durch ISTQB und German Testing Board. Bei so vielen Certified-Tester-Kursen sollte das Verfahrenswissen breiter verankert sein. Die Diskussion dreht sich stattdessen fast ausschließlich um Automatisierung, kaum noch darum, wie man die zu automatisierenden Testfälle überhaupt sinnvoll eingrenzt.

Mehr Werkzeuge lösen das Problem nicht automatisch. Whitebox-Informationen und Abdeckungsgrade liefern moderne Tools längst. Wenn Anwender trotzdem angeben, das Konzept nicht zu kennen, deutet wenig darauf hin, dass KI hier Abhilfe schafft.

Beim Testmanagement zeigt sich ein verwandtes Bild. Nur knapp 50 Prozent der Befragten setzen überhaupt ein Testmanagement-Werkzeug ein. Die übrigen arbeiten vermutlich mit Excel. Ein Werkzeug ist kein Ersatz für Verständnis, aber für eine Disziplin wie Qualität ist diese Quote dünn.

Agil oder hybrid? Viele Teams können sich nicht entscheiden

Hybrid ist 2024 so verbreitet wie agil, und das offenbart eine Inkonsistenz. Etwa gleich viele Teilnehmer bezeichnen ihre Vorgehensweise als agil wie als hybrid. Hinter hybrid steckt oft die Unfähigkeit, sich festzulegen: Man arbeitet vermeintlich agil, aber zentrale Entscheidungen trifft weiterhin die Chefetage.

Auch die Rollenverteilung spricht dieselbe Sprache. Die meisten ordnen sich den klassischen Rollen Entwickelnde oder Testende zu. Genuin agile Rollen wie Scrum Master, Product Owner oder Mitglied im agilen Team liegen jeweils unter 5 Prozent. Wer sich als agiles Teammitglied bezeichnet, findet sich teils trotzdem in einem klassischen, planorientierten Vorgehensmodell wieder.

Besonders aufschlussreich ist die testgetriebene Entwicklung, weil sich hier ein klarer Negativtrend zeigt:

Jahr	Anwendung testgetriebener Entwicklung
2016	67 %
2020	58 %
2024	48 %

Der Trend zeigt für jemanden, der agile Techniken schätzt, in die falsche Richtung. Pair Programming, Collective Code Ownership und Stand-up-Meetings als qualitätssichernde Maßnahme liegen alle unter 50 Prozent. Die entwicklungsnahen Praktiken sind verbreitet, die Praktiken, die Mindset und Organisation verändern, bleiben zurück.

Was Tester und Testmanager aus den Zahlen mitnehmen sollten

Zertifikate bleiben karriererelevant. Ein Drittel der Manager gibt auch 2024 an, dass eine Zertifizierung verpflichtend und alternativlos ist. Ein Zertifikat fördert die Karriere, es behindert sie nicht.

Beim Sicherheitstest lohnt sich aktives Werben in den eigenen Teams. Ein Sicherheitsfehler verzeiht selten einen zweiten Versuch. Genau diese Disziplin wird in der Umfrage als wenig spannend abgetan, was angesichts der realen Risiken schwer nachvollziehbar bleibt.

Die Zertifizierungskurse selbst könnten neu gedacht werden. Ein viertägiger Kurs vermittelt das Vokabular, aber nicht die Umsetzung im eigenen Kontext. Sinnvoll wäre eine Begleitung danach, etwa über Mentoring oder Usergroups, in denen man ein konkretes Problem mitbringen und besprechen kann. So werden Verfahren nicht nur als Begriffe gelernt, sondern verinnerlicht.

Trotz schnellerer Maschinen und besserer Automatisierung bleibt die Aussage über die Qualität des Testens die eigentliche Leistung. Wer die Verfahren beherrscht, kann beurteilen, was Werkzeuge und KI tatsächlich liefern.

Wo du die Ergebnisse findest

Alle Ergebnisse stehen frei und ohne Registrierung auf softwaretest-umfrage.de zur Verfügung. Dort liegen bereits das Management Summary sowie die statistischen Einzelauswertungen aller Fragen samt Grafiken, ebenso die Ergebnisse der früheren Umfragen.

Die ausführliche Broschüre mit den Best-of-Analysen umfasst rund 50 bis 60 Seiten und soll Ende Mai erscheinen. Der vollständige Technical Report wird für Ende des Sommers erwartet, deutlich früher als in den Vorjahren. Einzelne Vorträge und kürzere Berichte begleiten die Veröffentlichung, unter anderem beim German Testing Day und im SQ-Magazin.