Forschung
Quantenmaschinelles Lernen für die Teilchenphysik
Entweder Einsen oder Nullen, oder vielleicht beides? In Zusammenarbeit mit dem Imperial College und der Durham University arbeite ich an der Entwicklung neuartiger Algorithmen des quantenmaschinellen Lernens für die Teilchenphysik.
Quantencomputer unterscheiden sich grundlegend von klassischen Computern durch die Verwendung quantenmechanischer Mehrebenensysteme, bei denen es sich beispielsweise um Zwei-Niveau-Qubits anstelle von klassischen Bits handeln könnte. Während klassische Bits Informationen als binäre Zustände (0 oder 1) speichern, existieren Qubits als Superposition zweier Zustände, das heißt sowohl als Nullen als auch als Einsen. Für eine interaktive Visualisierung, wie dies aussieht, klicken Sie hier.
Sobald diese Daten kodiert sind, kann man gewissermaßen maschinelles Lernen an einem System von Qubits durchführen, indem man quantenmechanische Operationen wie Superposition, Verschränkung und parametrisierte (trainierbare) Rotationen verwendet.
Ich arbeite auch an der Entwicklung von Quantenalgorithmen für alternative Quantencomputermodelle, wie beispielsweise Geräte mit kontinuierlichen Variablen, die funktionieren, indem sie Informationen auf die Energieniveaus eines Photons kodieren.
Unüberwachtes maschinelles Lernen für die Suche nach neuer Physik
Als Teil des CMS Anomaly Search Effort (CASE) umfasst meine aktuelle Forschung die Entwicklung fortschrittlicher unüberwachter Machine-Learning-Architekturen, die darauf abzielen, die Anomalieerkennungsfähigkeiten erheblich zu verbessern.
Da sich Signaturen neuer Physik überall im mehrdimensionalen Phasenraum der Teilchenbeschleuniger-Daten manifestieren könnten, ist es unser Ziel, unsere ML-Modelle stattdessen mit einem tiefen Verständnis dessen auszustatten, wie das Standardmodell (SM) aussieht. Indem wir ein solches KI-Modell trainieren, SM-Phänomene genau zu erkennen und zu charakterisieren, bereiten wir es effektiv darauf vor, jegliche Abweichungen zu kennzeichnen, die potenzielle Indikatoren für neue Physik sein könnten, ohne sich auf vordefinierte Physikmodelle jenseits des Standardmodells (BSM) zu stützen. Dieser inhärent modellagnostische Ansatz macht die unüberwachte Anomalieerkennung besonders leistungsfähig und ermöglicht gleichzeitige Suchen nach seltenen oder unerwarteten Signalen über mehrere Endzustände, kinematische Regime und Ereignistopologien innerhalb der LHC-Kollisionsdaten hinweg.
Die CMS-EXO-22-026-Analyse ist die erste modellagnostische und unüberwachte Suchtechnik, die nach resonanten Anomalien in Dijet-Ereignissen sucht, die während der Run-2-Ära (2016-18) am CMS-Detektor aufgezeichnet wurden. Eine rigorose Anomaliesuche über das Dijet-Invariantmassenspektrum fand keine signifikanten Abweichungen von den Erwartungen des Standardmodells. Diese Analyse setzte auch Ausschlussgrenzen für eine große Anzahl exotischer Signalmodelle, von denen die meisten zum ersten Mal am LHC untersucht wurden.
Graph-Attention-basierte Transformatoren zur Pileup-Minderung
Pileup bezeichnet im Kontext des Large Hadron Collider (LHC) das Phänomen, bei dem mehrere Proton-Proton-Kollisionen gleichzeitig innerhalb einer einzigen Detektorauslesung auftreten, was die Rekonstruktion und Analyse von Kollisionsereignissen erschwert.
Diese überlappenden Wechselwirkungen erzeugen zusätzliches Rauschen und Hintergrundsignale und stellen erhebliche Herausforderungen für die genaue Identifizierung von Teilchen und die Messung ihrer Eigenschaften dar. In der Vergangenheit habe ich daran gearbeitet, die Auswirkungen von Pileup mithilfe von Graph-Attention (GAT)-basierten neuronalen Netzwerken zu mindern. Ich habe auch eine Bachelorarbeit am KIT betreut, um die Möglichkeit zu untersuchen, Wissen von einem ausgeklügelten GAT-Modell in ein einfacheres tiefes neuronales Netzwerk (DNN) zu destillieren, wodurch eine vergleichbare Leistung bei erheblich reduzierter Rechenkomplexität ermöglicht wird.