So entsteht das perfekte Konferenz-Programm

Das Programm einer Software-Testkonferenz entsteht durch einen mehrstufigen Auswahlprozess: Ein Programmkomitee bewertet alle Einreichungen, jede davon durch mindestens drei Reviewer. Bei der Eurostar kamen auf rund 50 Programmplätze über 527 gültige Einreichungen, was einer Akzeptanzrate unter zehn Prozent entspricht. Qualität, Praxisbezug und thematische Balance entscheiden über die Aufnahme.

Das Wichtigste in Kürze

Von 527 gültigen Einreichungen schafft es weniger als jede zehnte ins Eurostar-Programm, weil rund 50 Slots auf eine unter-10%-Akzeptanzrate treffen.
KI-generierte Abstracts werden nicht wegen ihrer Herkunft abgelehnt, sondern weil sie unklar lassen, was das Problem ist, wer spricht und welche eigene Erfahrung dahintersteht.
Wer eine Ablehnung bekommt und Feedback anfragt, erhält bei der Eurostar eine individuelle Rückmeldung, die konkrete Verbesserungen für den nächsten Einreichungsversuch nennt.
Mitglieder des Programmkomitees und ihre Firmenkollegen dürfen auf der Eurostar nicht sprechen, damit kein Interessenkonflikt bei der Programmauswahl entsteht.
Wer einen Vortrag einreichen will, erhöht seine Chancen, wenn er früh beginnt, das Abstract von jemandem gegenlesen lässt und sich ruhig direkt an den Program Chair wendet.

Was eine gute Testkonferenz von einer durchschnittlichen unterscheidet

Eine gute Konferenz entsteht nicht dadurch, dass man die besten Vorträge hat, sondern durch den Prozess, der zu diesen Vorträgen führt. Die Antwort “die besten Vorträge auswählen” ist genauso leer wie die Aussage, gute Software entstehe dadurch, dass man gute Software schreibt.

Aus einer Qualitätsperspektive zählt der Auswahlprozess dahinter. Wie filtert ein Programmkomitee aus hunderten Einreichungen die wenigen heraus, die ins Programm kommen? Welche Kriterien entscheiden? Wie sorgt man dafür, dass am Ende plausibel ein starkes Endprodukt steht?

Genau hier liegt der Unterschied zwischen Konferenzen. Nicht in leicht abweichenden Spielregeln, sondern darin, wie streng und wie strukturiert der Filter arbeitet.

Wie ein Programmkomitee aus 527 Einreichungen ein Programm baut

Der Program Chair ist für das Programm verantwortlich und stellt dafür ein kleines Team zusammen. Bei der diesjährigen Eurostar in Oslo bestand dieses Komitee aus fünf Personen. Ihre primäre Aufgabe: ein Filter zu sein zwischen allen Einreichungen und dem, was tatsächlich auf die Bühne kommt.

Die Zahlen zeigen, wie eng dieser Filter ist. 527 vollständige, gültige Einreichungen gingen in den Review-Prozess, nachdem unvollständige oder offensichtlich unbrauchbare Beiträge bereits aussortiert waren. Dem standen rund 50 Slots im Programm über drei Tage gegenüber. Das ergibt eine Akzeptanzrate von unter 10 Prozent.

Jedes Komiteemitglied bewertete etwa 100 Einreichungen. Zusätzlich schaute sich pro Beitrag mindestens ein weiterer Reviewer die Einreichung an, sodass jeder Vortrag mindestens drei Bewertungen erhielt. Diese Reviewer kommen aus der Community: Menschen, die selbst schon gesprochen haben, in den Themen stecken und sich ehrenamtlich durch die Beiträge arbeiten.

Eine so niedrige Akzeptanzrate trennt die Eurostar von den meisten anderen Testkonferenzen. Sie hat zur Folge, dass viele gute Vorträge abgelehnt werden, nicht weil sie schlecht sind, sondern weil ein anderer Beitrag zum selben Thema noch einen Tick besser war.

Warum ein abgelehnter Vortrag oft trotzdem gut ist

Eine Ablehnung bedeutet bei knappen Slots selten, dass die Einreichung schwach war. Bei einer Akzeptanzrate unter 10 Prozent fallen Beiträge heraus, die auf jeder anderen Konferenz angenommen worden wären.

Bei der Eurostar gibt es nach einer Absage die Möglichkeit, nach den Gründen zu fragen. Für die diesjährige Ausgabe wurden rund 70 solcher Anfragen einzeln beantwortet: Einreichung erneut angeschaut, das Video gesichtet, alle Review-Kommentare gelesen und daraus konstruktives Feedback formuliert, das die Chancen in der nächsten Runde erhöht.

Dieses Feedback bringt dem laufenden Programm nichts mehr. Es entsteht aus der eigenen Erfahrung, wie frustrierend eine Ablehnung ohne Begründung ist. Wer nur ein “Nein” bekommt und auf Nachfrage gar nichts oder wieder nur ein “Nein” hört, lernt daraus nichts.

Für Sprecher ist genau dieses Feedback wertvoll. Es zeigt, ob mehr Praxis gefehlt hat, die Beispiele anders gewählt sein sollten oder schlicht das Wording den Kern verfehlt hat. Manchmal liegt es nur an einer Nuance.

Verschiedene Perspektiven im Komitee machen das Programm besser

Ein Programmkomitee sollte bewusst unterschiedliche Werdegänge versammeln. Wenn fünf Menschen mit verschiedenem beruflichem Hintergrund auf dieselbe Einreichung schauen, fängt diese Mischung Beiträge auf, die eine einzelne Perspektive übersehen hätte.

Ein Vortrag, der eine Person kaltlässt, kann eine andere aus einem nachvollziehbaren Grund stark überzeugen. Aus diesen Reibungen entstehen die Diskussionen, die ein Programm ausbalancieren: Was bringt eine Perspektive, die sonst fehlt? Was ergänzt das Bild?

Bei knappen Slots wird oft ums Detail gerungen. Die Entscheidung zwischen zwei sehr guten, thematisch ähnlichen Vorträgen ist nicht angenehm, weil nur einer von beiden reinpasst.

Warum ein KI-generiertes Abstract selten überzeugt

Ein vollständig KI-generiertes Abstract scheitert nicht, weil es von einer KI stammt, sondern weil es meist schlecht ist. Unklar bleibt, worum es geht, was der Beitrag bringt und was die sprechende Person dafür qualifiziert.

Ein exzellenter Vortrag lebt von eigener Arbeitserfahrung. Von eigenen Misserfolgen, eigenen Erfolgen, von Dingen, die man selbst gemacht hat. Dafür ist man der beste Experte, kann authentisch auf Fragen antworten und besitzt Material, das kein Sprachmodell kennt. Eine KI weiß nicht, was du an deiner Arbeit erlebt hast.

Gegen den Einsatz von Sprachmodellen spricht nichts, solange sie unterstützen statt ersetzen. Gerade für Nicht-Muttersprachler hilft es, sich Vorschläge auf Wort- oder Satzebene anzusehen. Entscheidend ist die Prüfung jedes einzelnen Vorschlags: Klingt der Satz noch nach dir? Wird er wirklich einfacher? Hättest du es selbst so formuliert? Dann übernimm ihn. Sonst nicht.

Ein verräterisches Muster: Wenn ein Abstract dreimal gelesen immer noch keine klare Aussage hergibt, stellt sich beim Check durch ein Erkennungstool fast immer heraus, dass der Text zu 100 Prozent generiert war.

Ein Pflicht-Video hebt die Einstiegsschwelle

Ein verpflichtender Videolink bei der Einreichung filtert wahllose, rein generierte Beiträge aus. Bei der Eurostar reichen 30 Sekunden, direkt mit dem Handy aufgenommen.

Das Video erfüllt zwei Zwecke. Es erhöht den Aufwand so weit, dass niemand einfach drauflosballert und generiertes Material einreicht. Und es gibt dem Komitee einen Eindruck davon, wie eine Person agiert, wenn sie spricht, und ob das gesamte Setting plausibel zusammenpasst.

Keynotes leben vom außergewöhnlichen Werdegang

Die interessantesten Keynotes halten Menschen mit einem ungewöhnlichen Berufsweg, die dabei etwas erlebt haben, das für die Community relevant und noch nicht oft erzählt ist. Die eigene Erfahrung ist auch hier die beste Voraussetzung.

Zwei Beispiele aus dem diesjährigen Programm zeigen das Prinzip. Wolfgang Platz, Gründer von Tricentis, entwickelte Tosca als Testautomatisierungslösung innerhalb der Allianz, gründete daraus ein Unternehmen aus und baute es über Jahrzehnte auf. Aus dieser Spanne kann er erzählen, wie sich Testen und Testautomatisierung über drei Jahrzehnte und über verschiedene Kulturen, Organisationen und Domänen hinweg verändert haben.

Michael Kutz durchlief verschiedene Rollen im selben Konzern, immer mit Fokus auf Softwarequalität. Seine Frage richtet sich auf die Teams: Warum funktionieren manche sehr gut und andere nicht, und welche Faktoren entscheiden darüber? Die Qualitätsbrille richtet sich dabei nicht nur auf Software, sondern auch auf das Team.

Anwender gehören stärker aufs Programm

Konferenzen bekommen überproportional viele Einreichungen von Menschen, die vom Vortragen leben oder ein Produkt sichtbarer machen wollen. Das können hervorragende Vorträge sein, muss es aber nicht.

Unterrepräsentiert ist dagegen oft die Gruppe der Anwender: Menschen, die selbst ein Unternehmen testen, eine Testabteilung leiten oder ein Werkzeug einführen und darüber berichten. Genau diese Stimmen brauchen ein besonderes Augenmerk, damit sie stark im Programm vertreten sind.

Dass jemand ein Produkt im Hintergrund hat, schließt einen guten Vortrag nicht aus. Es kommt darauf an, ob Storys, Erfahrungen und neue Erkenntnisse im Vordergrund stehen und das Produkt dahinter zurücktritt.

Eine strikte Regel gegen Selbstplatzierung

Bei der Eurostar dürfen weder das Programmkomitee noch der Program Chair selbst sprechen. Auch niemand, der in den Firmen der Komiteemitglieder arbeitet, kommt aufs Programm.

Diese Regel verhindert den Eindruck, das Komitee suche sich ein Programm zusammen, um sich selbst auf die Bühne zu stellen. Sie zwingt zur Konzentration auf ein gutes Programm, statt noch hier und da einen Kollegen unterzubringen. Für sehr große Firmen ist das hart, weil das ganze Unternehmen für ein Jahr aussetzt. Aber so funktioniert die Trennung.

Aus eigener Erfahrung sprechen schlägt jede generische Folie

Die lohnenswertesten Vorträge berichten konkret: Das haben wir gemacht, das hat funktioniert, das nicht, das Problem ist so ausgegangen. Nicht “hier sind die möglichen Probleme und vielleicht klappt es”, sondern ein echter Rückblick aus der Praxis.

Beim Thema KI im Testen markiert die diesjährige Eurostar einen Wendepunkt. Es ist die erste Ausgabe mit Beiträgen, die einen Einsatz über ein Jahr hinweg auswerten, weil die Werkzeuge davor schlicht zu jung waren. Die Diskussion verschiebt sich von “wir müssen das nutzen und aufpassen” hin zu konkreten Anwendungen und der Frage, wie Mensch und KI sinnvoll zusammenspielen.

Drei Beispiele zeigen die Bandbreite gut, weil sie jeweils eine eigene Domäne mit einer konkreten Erfahrung verbinden:

Vortrag	Sprecher / Quelle	Worum es geht
Closing the Loop: Using Field Data as a Quality Metric	Florian Wartenberg, Vestas	Fehlerdaten aus dem Feld nutzen, um Test- und Qualitätssicherung zu verbessern. Ein Fehler kostet direkt Geld, weil eine Windturbine dann weniger Strom liefert.
Exploratory Testing for Massively Multiplayer Online Games	Oliver Hilt	Exploratives Testen in der Spieldomäne. Ein Fehler führt nicht zu stehender Hardware, sondern zu abspringenden Spielern, also zu finanziellem Schaden auf ganz andere Art.
Using AI to Create User Acceptance Tests: A Case Study from BBC Radio	BBC Radio	KI zur Erstellung von User-Acceptance-Tests, ausgewertet als konkreter Case mit Rückblick, wie es geklappt hat.

Diese Vorträge tragen, weil sie aus einer realen Anwendung erzählen. Eine gewisse Reife ist erkennbar, gerade für die kurze Zeit, in der die Werkzeuge verfügbar sind.

Wie du als Sprecher die Schwelle zum Call for Papers überwindest

Fang früh mit dem Abstract an, nicht auf den letzten Drücker. Der Grund ist tückisch: Je besser du ein Thema kennst, desto schwerer fällt es, dich in jemanden hineinzuversetzen, der es nicht kennt. Ausgerechnet bei den Themen, für die du am besten geeignet bist, triffst du oft den falschen Abstraktionslevel.

Lass dein Abstract reviewen, idealerweise von einer Kollegin oder einem Kollegen direkt zur Hand. Ungewöhnlich, aber wirksam: Schreib das Programmkomitee oder den Program Chair an. Schildere kurz dein Thema, frag, ob es passt, und schick einen Vorschlag. Das passiert selten, hilft aber beiden Seiten, weil der Beitrag dadurch besser wird.

Sprich über etwas, wozu du eine persönliche Erfahrung hast. Schon aus deinem Lebenslauf und der kurzen Bio sollte ein Reviewer erkennen, dass du hier aus eigener Praxis berichtest.

Und dann: trauen. Bammel davor ist normal, das geht allen so. Manchmal hilft es, die Einreichung einfach im richtigen Moment abzuschicken, bevor die Zweifel zurückkommen.

Zwischen der Zusage und der Konferenz liegt in der Regel ein Vierteljahr bis halbes Jahr Vorbereitungszeit. Nutze sie für einen Probevortrag. Zuerst für dich allein, um Folienübergänge und Timing zu prüfen, dafür brauchst du kein Publikum. Danach vor einem kleinen Testpublikum, das dir echtes Feedback gibt.