-
QINNs: Quantum Informed Neural Networks
Aritra Bal, Markus Klute, Benedikt Maier, Melik Oughton, Eric Pezone, Michael Spannowsky
• Im Peer-Review-Verfahren
Klassische tiefe neuronale Netzwerke können umfangreiche Mehrteilchen-Korrelationen in Kollisionsdaten lernen, aber ihre induktiven Verzerrungen sind selten in physikalischen Strukturen verankert. Wir schlagen quanteninformierte neuronale Netzwerke (QINNs) vor, ein allgemeines Framework, das Konzepte der Quanteninformation und Quantenobservablen in rein klassische Modelle einbringt. Während das Framework breit angelegt ist, untersuchen wir in dieser Arbeit eine konkrete Realisierung, die jedes Teilchen als Qubit kodiert und die Quanten-Fisher-Informationsmatrix (QFIM) als kompakte, basisunabhängige Zusammenfassung von Teilchenkorrelationen verwendet. Anhand der Jet-Klassifizierung als Fallstudie fungieren QFIMs als leichtgewichtige Einbettungen in Graph-Neuronalen Netzwerken und erhöhen die Modellausdrucksfähigkeit und Plastizität. Die QFIM zeigt unterschiedliche Muster für QCD- und hadronische Top-Jets, die mit physikalischen Erwartungen übereinstimmen. Somit bieten QINNs einen praktischen, interpretierbaren und skalierbaren Weg zu quanteninformierten Analysen, d.h. Tomographie, von Teilchenkollisionen, insbesondere durch die Verbesserung etablierter Deep-Learning-Ansätze.
-
One Particle - One Qubit: Particle Physics Data Encoding for Quantum Machine Learning
Aritra Bal, Markus Klute, Benedikt Maier, Melik Oughton, Eric Pezone, Michael Spannowsky
• Veröffentlicht in Physical Review D (Impact Factor: 9)
• Präsentiert auf EPS HEP 2025 (Marseille)
• Präsentiert auf ML4Jets 2025 (CalTech)
Wir stellen 1P1Q vor, ein neuartiges Quantendatenkodierungsschema für Hochenergiephysik (HEP), bei dem jedes Teilchen einem einzelnen Qubit zugeordnet wird, was eine direkte Darstellung von Kollisionsereignissen ohne klassische Kompression ermöglicht. Wir demonstrieren die Wirksamkeit von 1P1Q im quantenmaschinellen Lernen (QML) anhand zweier Anwendungen: einem Quanten-Autoencoder (QAE) für unüberwachte Anomalieerkennung und einem Variationalen Quantenschaltkreis (VQC) für überwachte Klassifizierung von Top-Quark-Jets. Unsere Ergebnisse zeigen, dass der QAE Signal-Jets erfolgreich von Hintergrund-QCD-Jets unterscheidet und eine überlegene Leistung im Vergleich zu einem klassischen Autoencoder erzielt, während er erheblich weniger trainierbare Parameter verwendet. Ebenso erreicht der VQC eine wettbewerbsfähige Klassifizierungsleistung und nähert sich modernsten klassischen Modellen an, trotz seiner minimalen Rechenkomplexität. Darüber hinaus validieren wir den QAE an realen experimentellen Daten des CMS-Detektors und etablieren damit die Robustheit von Quantenalgorithmen in praktischen HEP-Anwendungen. Diese Ergebnisse zeigen, dass 1P1Q eine effektive und skalierbare Quantenkodierungsstrategie bietet und neue Möglichkeiten für die Anwendung von Quantencomputing-Algorithmen in der Kollisionsdatenanalyse eröffnet.
-
Model-agnostic search for dijet resonances with anomalous jet substructure in proton-proton collisions at √s = 13 TeV
CMS-Kollaboration
• Veröffentlicht in Reports on Progress in Physics (Impact Factor: 19)
• Präsentiert auf ML4Jets 2024 (Paris)
Diese Arbeit präsentiert eine modellagnostische Suche nach schmalen Resonanzen im Dijet-Endzustand im Massenbereich von 1,8–6 TeV. Es wird angenommen, dass das Signal Jets mit einer für Jets aus leichten Quarks oder Gluonen untypischen Substruktur erzeugt, mit minimalen zusätzlichen Annahmen. Suchregionen werden durch Verwendung multivariater Machine-Learning-Methoden zur Auswahl von Jets mit anomaler Substruktur erhalten. Eine Sammlung komplementärer Anomalieerkennungsmethoden – basierend auf unüberwachten, schwach überwachten und halbüberwachten Algorithmen – wird verwendet, um die Sensitivität für unbekannte neue Physiksignaturen zu maximieren. Diese Algorithmen werden auf Daten angewendet, die einer integrierten Luminosität von 138 fb⁻¹ entsprechen und vom CMS-Experiment am LHC bei einer Schwerpunktsenergie von 13 TeV aufgezeichnet wurden. Es werden keine signifikanten Überschüsse über den Hintergrunderwartungen beobachtet. Ausschlussgrenzen werden für den Produktionswirkungsquerschnitt von Benchmark-Signalmodellen abgeleitet, die in Resonanzmasse, Jet-Masse und Jet-Substruktur variieren. Viele dieser Signaturen wurden zuvor nicht untersucht, was mehrere der berichteten Grenzen für die entsprechenden Benchmark-Modelle zu den ersten überhaupt macht. Im Vergleich zu Benchmark-inklusiven und substrukturbasierten Suchstrategien wird festgestellt, dass die Anomalieerkennungsmethoden die Sensitivität für eine Vielzahl von Modellen erheblich verbessern.
-
Distilling particle knowledge for fast reconstruction at high-energy physics experiments
Aritra Bal, Tristan Brandes, Fabio Iemmi, Markus Klute, Benedikt Maier, Vinicius Mikuni, Thea Klaeboe Aarrestad
Veröffentlicht in Machine Learning Science and Technology
(Diese Arbeit war die Bachelorarbeit von T. Brandes) Wissensdestillation ist eine Form der Modellkompression, die es künstlichen neuronalen Netzwerken unterschiedlicher Größe ermöglicht, voneinander zu lernen. Ihre Hauptanwendung ist die Kompaktifizierung großer tiefer neuronaler Netzwerke, um Rechenressourcen freizusetzen, insbesondere auf Edge-Geräten. In diesem Artikel betrachten wir Proton-Proton-Kollisionen am High-Luminosity Large Hadron Collider (HL-LHC) und demonstrieren einen erfolgreichen Wissenstransfer von einem ereignisbasierten Graph-Neuronalen Netzwerk (GNN) zu einem teilchenbasierten kleinen tiefen neuronalen Netzwerk (DNN). Unser Algorithmus, DistillNet, ist ein DNN, das trainiert wird, um die Herkunft von Teilchen zu lernen, wie sie durch die Soft-Labels bereitgestellt wird, die die GNN-Ausgaben sind, um vorherzusagen, ob ein Teilchen vom primären Wechselwirkungsvertex stammt oder nicht. Die Ergebnisse zeigen, dass es für dieses Problem, das eine der Hauptherausforderungen am HL-LHC darstellt, nur minimale Verluste während des Wissenstransfers zum kleinen Student-Netzwerk gibt, während der Bedarf an Rechenressourcen im Vergleich zum Lehrer erheblich verbessert wird. Dies wird für das destillierte Student-Netzwerk auf einer CPU sowie für ein quantisiertes und beschnittenes Student-Netzwerk demonstriert, das auf einem Field Programmable Gate Array eingesetzt wird. Unsere Studie beweist, dass Wissenstransfer zwischen Netzwerken unterschiedlicher Komplexität für schnelle künstliche Intelligenz (KI) in der Hochenergiephysik verwendet werden kann, die die Ausdruckskraft von Observablen gegenüber nicht-KI-basierten Rekonstruktionsalgorithmen verbessert. Ein solcher Ansatz kann für die HL-LHC-Experimente wesentlich werden, z.B. um das Ressourcenbudget ihrer Trigger-Stufen einzuhalten.
-
Machine learning techniques for model-independent searches in dijet final states
CMS-Kollaboration
In Vorbereitung für die Veröffentlichung
Wir präsentieren die Leistung von Machine-Learning-basierten Anomalieerkennungstechniken zur Extraktion potenzieller neuer Physikphänomene auf modellagnostische Weise mit dem CMS-Experiment am Large Hadron Collider. Wir stellen fünf verschiedene Ausreißererkennungs- oder Dichteschätzungstechniken vor, nämlich CWoLa, Tag N'Train, CATHODE, QUAK und QR-VAE, die auf die Identifizierung anomaler Jets zugeschnitten sind, die aus dem Zerfall unbekannter schwerer Teilchen stammen. Wir demonstrieren den Nutzen dieser verschiedenen Ansätze zur Verbesserung der Sensitivität für eine breite Palette potenzieller Signale und bewerten ihre vergleichende Leistung in der Simulation.