Komplexität mit Deep-Learning-Strategien lösen
Der PXD ist der innerste Spurdetektor von Belle II und verfügt über mehr als 7,5 Millionen Informationskanäle. „Diese hohe Komplexität macht die Simulation dieses Detektors zu einem extrem nicht-trivialen Problem“, erklärt uns Baran Hashemi, Erstautor der Veröffentlichung.
Um die detaillierten Intra-Event-Korrelationen nachzubilden und realitätsnahe Muster zu erzeugen, hat das LMU-Team ein Intra-Event Aware Generative Adversarial Network (IEA-GAN) entwickelt. Sie entwickelten mehrere neuartige KI-Techniken, die an der Schnittstelle zwischen den Bausteinen von Large Language Models wie ChatGPT, tiefen generativen Modellen und der dunklen Materie der Intelligenz, auch bekannt als Self-Supervised Learning, liegen, um eine Dreifaltigkeit von Ideen zu schaffen, die das Problem der Komplexität lösen.
Apropos Ereignisse: Das Intra-Event Aware Generative Adversarial Network
IEA-GAN ist eine Verschmelzung von Transformers, Generative Adversarial Networks (GANs) und Self-Supervised Learning. Generative Adversarial Networks (GANs) inszenieren ein kontradiktorisches Spiel zwischen zwei neuronalen Netzwerkagenten: einem Generator und einem Diskriminator. Durch diese Synergie im generativen Prozess kommunizieren die PXD-Detektorkomponenten miteinander und geben Nachrichten über den Aufmerksamkeitsmechanismus der Transformers weiter. In der neuen Version des Transformers - das LMU-Team gab ihm den Namen 'relationale Reasoning Module' (RRM) - agieren die PXD-Sensoren wie Wörter, die die Ereignisse aufbauen. So wird jedes Kollisionsereignis als ein Satz betrachtet. RRM gruppiert PXD-Muster in einem Ereignis als Wörter in einem Satz, basierend auf ihrer Korrelation, und lernt den kontextuellen Grad der Ähnlichkeit zwischen den Mustern in einem Ereignis.
Ereignisse im Klassenzimmer: Bewältigung des Problems des Intra-Event Aware Loss
Auf diese Weise erzeugt IEA-GAN korrelierte PXD-Signaturen mit mehrteiligem Ursprung. Eine große Herausforderung besteht darin, dass die Signaturen von PXD-Komponenten in einem Ereignis dazu neigen, einander zu ähneln, wie zwei semantisch ähnliche Wörter. Dies führt zu einem Phänomen, das bei tiefen generativen Modellen als Klassenkonfusion bezeichnet wird. Um das Problem der Klassenkonfusion in konditionalen generativen Modellen in den Griff zu bekommen, führten sie eine Fehlerfunktion des selbstüberwachten Lernens ein, den Intra-Event Aware Loss (IEA Loss), bei dem der generative Agent als Schüler durch dyadischen Informationstransfer die Interpretation jedes Ereignisses durch den Diskriminator, den Lehrer, nachahmt.
Erfolg bei vorläufigen Studien
Schließlich führte das Team eine eingehende statistische Analyse der Auswirkungen der Korrelation zwischen den PXD-Sensoren durch und zeigte, dass IEA-GAN diese Korrelation erfassen kann, was zu einer präzisen Rekonstruktion der Parameter der Gleis-Helix führte. „Mit IEA-GAN, das in die Belle II Software implementiert wird, hoffen wir, die Simulationspipeline für das Belle II Experiment zu verbessern, indem wir den Rechen- und Speicherbedarf traditioneller Simulationsmethoden reduzieren“, so Baran Hashemi abschließend.
Zur Veröffentlichung: https://www.nature.com/articles/s41467-024-49104-4