Datenanalysen

Der kühle Rechner

Physiker Marcin Chrząszcz erforscht am Cern das Verhalten exotischer Elementarteilchen. Für die Datenanalysen hat er einen wissenschaftlichen Wettbewerb ausgeschrieben und Lösungen am Physik-Institut präsentiert.

Stefan Stöcklin

Datenanalyst Marcin Chrząszcz
«Fast nicht nachweisbar»: Physiker und Datenanalyst Marcin Chrząszcz beschäftigt sich mit extrem seltenen Zerfällen subatomarer Teilchen. (Bild: sts)

Der Teilchenphysiker Marcin Chrząszcz  - ausgesprochen Schratsch  – entspricht auf einen ersten flüchtigen Blick manchem Klischee, das gegenüber Physikern kursiert: Er ist intelligent, wirkt introvertiert und überlegt genau, bevor er auf Fragen antwortet. Doch sobald sein Forschungsthema angesprochen wird, das heisst Zerfälle von subatomaren Elementarteilchen, wird der ruhige Wissenschaftler leidenschaftlich.

Mit kräftiger Stimme erläutert er die Essenz seiner Arbeiten und unterstreicht mit den Armen das Gesagte: «Ich beschäftige mich mit Zerfällen von subatomare Teilchen wie B-Mesonen oder Tau-Leptonen». Die instabilen B-Mesonen enthalten Quarks und Antiquarks und sind Teil des Standardmodells der Teilchenphysik. Teil  des Standardmodells sind auch Leptonen, zu denen zum Beispeil stabile Teilchen wie das Elektron oder instabile Tauonen (Tau-Leptonen) gehören.

Reale und hypothetische Zerfälle derartiger Teilchen waren kürzlich Thema eines Symposiums über Data-Mining am Physik-Institut der UZH, das der Teilchenphysiker mitorganisiert hatte. Nun kommt der Datenanalyst in Fahrt: «Meine Kolleginnen und Kollegen haben Nachweisverfahren vorgestellt, um extrem seltene Zerfallsereignisse statistisch signifikant nachzuweisen.»

Detektoren am LHC

Marcin Chrząszcz ist PostDoc in der Arbeitsgruppe von Ueli Straumann und arbeitet die meiste Zeit im Cern bei Genf. Der Teilchenbeschleuniger LHC (Large Hadron Collider, LHC) ist sein Arbeitswerkzeug, genauer gesagt der LHCb-Detektor, einer von mehreren Nachweisapparaturen.

Der Teilchenbeschleuniger machte vor drei Jahren mit dem erstmaligen Nachweis des Higgs-Bosons Schlagzeilen. Während das Higgs-Boson in zwei riesigen, haushohen Detektoren namens CMS und ATLAS nachgewiesen wurde, beschäftigen sich die Forschenden am kleineren LHCb-Detektor mit leichteren Teilchen, die in Quarks und Antiquarks zerfallen.

Die Messung seltener Zerfälle im LHCb-Detektor ist das tägliche Brot des polnischen Forschers. Und so kam er zusammem mit Kollegen auf die Idee, Aspekte des Forschungsgebiets zum Thema eines internationalen Kaggle-Wettbewerbs über Datenanalysen zu machen. Bei diesen Wettbewerben stellt man der wissenschaftlichen Community von Datenanalysten eine möglichst interessante Frage und prämiert danach in einem Wettbewerb die besten Lösungen. (Siehe Box zum Kaggle-Wettbewerb)

Extrem seltener Zerfall

«Wir stellten hypothetische Zerfälle von B-Mesonen und Tau-Leptonen zur Diskussion», sagt Marcin Chrząszcz. Konkret bestand die Aufgabe in der Entwicklung eines Programm, das allfällige Signale aus realen und hypothetischen Daten identifizieren können muss.

«Es ging um den Nachweis eines Zerfalls, der extrem selten ist und von dem man nicht einmal weiss, ob er überhaupt existiert,» so der Teilchenphysiker. Bei den genannten Zerfällen ist die Eintretenswahrscheinlichkeit mit 10-40 unvorstellbar klein. Das heisst sie entspricht einer 1, die erst 40 Stellen hinter dem Komma steht.

Was ziemlich abgehoben und rein akademisch tönt, ist Tat und Wahrheit ein topaktuelles und heisses Forschungsgebiet. Denn im Kern geht es darum, in riesigen Datensätzen eindeutige Muster zu erkennen, das heisst Signale aus dem Rauschen herauszufiltern. Viele Anwendungen unserer zunehmend digitalen Welt basieren auf dieser Fähigkeit von Algorithmen, Daten zu durchforsten und richtig zu interpretieren. Man denke an die digitale Gesichtserkennung oder selbststeuernde Autos.

Hochaktuelles Thema

«Das Feld der Datenanalysen und Mustererkennung explodiert geradezu», sagt Marcin Chrząszcz. Entsprechend war der Kaggle-Wettbewerb ein durchschlagender Erfolg. An der von ihm initiierten wissenschaftlichen Herausforderung nahmen 673 Teams aus der ganzen Welt teil. Gewonnen hat ein Team um den russischen Datenanalysten Alexander Guschin. Es konnte seine Lösung im Rahmen eines Workshops über Data-Mining und den LHCb kürzlich am Physik-Institut der UZH präsentieren.

Der für Nicht-Physiker schwer nachvollziehbare Vorschlag erntete an der Zürcher Veranstaltung viel Applaus, freut sich Marcin Chrząszcz. Dass die Mehrheit der Wettbewerbsteilnehmenden aus Osteuropa und Russland stammten, sei im übrigen zufällig. Und dass er selbst aus Polen kommt, auch dies entspreche nur einem verbreiteten Klischee über mathematisch begabte Osteuropäer.

 

Wettbewerb für die cleverste Lösung

Bei Kaggle handelt es sich um eine öffentliche  Homepage von Datenexperten aus den USA (San Francisco), die über das Portal Fragestellungen verbreiten und einen Wettbewerb zur besten Lösung damit verknüpfen. Experten aber auch Laien können ihr Problem beschreiben und die dazu nötigen Daten hochladen. Einzige Bedingung ist die Zulassung der Fragestellung durch ein Expertenteam, wobei diese Prüfung 10000 Dollar kostet, danach gibt es keine Restriktionen. Die ersten drei Gewinner erhalten einen Preis. Seit der Gründung 2010 wurden zahlreiche Wettstreite zu physikalischen, medizinischen, astronomischen oder kulturellen Fragestellungen durchgeführt. Aktuell gibt es zum Beispiel Wettbewerbe zur Diagnose von Herzkrankheiten aus CT-Daten, Gesichtserkennung oder Bankenzahlungen.

Stefan Stöcklin, Redaktor UZH News

Kommentar schreiben

Die Redaktion behält sich vor, Kommentare nicht zu publizieren. Unberücksichtigt bleiben insbesondere anonyme, ehrverletzende, rassistische, sexistische, unsachliche oder themenfremde Kommentare sowie Beiträge mit Werbeinhalten.

Anzahl verbleibender Zeichen: 1000