Ein entscheidendes Computerprogramm für Teilchenphysik droht zu veralten


Kürzlich habe ich zugesehen ein befreundeter Teilchenphysiker spricht über eine Berechnung, die er auf eine neue Höhe der Präzision gebracht hat. Sein Werkzeug? Ein Computerprogramm aus den 1980er Jahren namens FORM.

Teilchenphysiker verwenden einige der längsten Gleichungen in der gesamten Wissenschaft. Um beispielsweise bei Kollisionen am Large Hadron Collider nach Anzeichen für neue Elementarteilchen zu suchen, zeichnen sie Tausende von Bildern, sogenannte Feynman-Diagramme, die mögliche Kollisionsergebnisse darstellen, wobei jedes eine komplizierte Formel codiert, die Millionen von Begriffen lang sein kann. Formeln wie diese mit Stift und Papier zusammenzufassen ist unmöglich; selbst das Hinzufügen mit Computern ist eine Herausforderung. Die Algebraregeln, die wir in der Schule lernen, sind schnell genug für Hausaufgaben, aber für die Teilchenphysik sind sie erschreckend ineffizient.

Programme, die als Computeralgebrasysteme bezeichnet werden, bemühen sich, diese Aufgaben zu bewältigen. Und wenn Sie die größten Gleichungen der Welt lösen wollen, sticht seit 33 Jahren ein Programm heraus: FORM.

Entwickelt vom holländischen Teilchenphysiker Jos Vermaseren, FORM ist ein wichtiger Bestandteil der Infrastruktur der Teilchenphysik, der für die schwierigsten Berechnungen benötigt wird. Wie bei überraschend vielen wesentlichen Teilen der digitalen Infrastruktur ruht die Wartung von FORM jedoch weitgehend auf einer Person: Vermaseren selbst. Und mit 73 hat er begonnen, sich aus der FORM-Entwicklung zurückzuziehen. Aufgrund der Anreizstruktur der Wissenschaft, die veröffentlichte Artikel und nicht Softwaretools prämiert, hat sich kein Nachfolger herauskristallisiert. Wenn sich die Situation nicht ändert, könnte die Teilchenphysik gezwungen sein, sich dramatisch zu verlangsamen.

FORM begann Mitte der 1980er Jahre, als sich die Rolle von Computern schnell veränderte. Sein Vorgänger, ein von Martinus Veltman entwickeltes Programm namens Schoonschip, wurde als spezialisierter Chip herausgebracht, den man seitlich in einen Atari-Computer steckte. Vermaseren wollte ein zugänglicheres Programm erstellen, das von Universitäten auf der ganzen Welt heruntergeladen werden kann. Er begann, es in der Computersprache FORTRAN zu programmieren, was für Formula Translation steht. Der Name FORM war eine Anspielung darauf. (Er wechselte später zu einer Programmiersprache namens C.) Vermaseren veröffentlichte seine Software 1989. Anfang der 90er Jahre hatten über 200 Institutionen auf der ganzen Welt sie heruntergeladen, und die Zahl stieg weiter.

Seit dem Jahr 2000 wurde im Durchschnitt alle paar Tage ein Artikel über Teilchenphysik veröffentlicht, der FORM zitiert. “Die meisten von den [high-precision] Ergebnisse, die unsere Gruppe in den letzten 20 Jahren erhalten hat, basierten stark auf dem FORM-Code“, sagte er Thomas GehrmannProfessor an der Universität Zürich.

Ein Teil der Popularität von FORM kam von spezialisierten Algorithmen, die im Laufe der Jahre entwickelt wurden, wie z. B. ein Trick zum schnellen Multiplizieren bestimmter Teile eines Feynman-Diagramms und ein Verfahren zum Neuanordnen von Gleichungen, um so wenig Multiplikationen und Additionen wie möglich zu haben. Aber der älteste und mächtigste Vorteil von FORM ist, wie es mit dem Speicher umgeht.

So wie Menschen zwei Arten von Gedächtnis haben, Kurzzeit- und Langzeitgedächtnis, haben Computer zwei Arten: Haupt- und externe. Auf den Hauptspeicher – den Arbeitsspeicher Ihres Computers – kann schnell zugegriffen werden, er ist jedoch in seiner Größe begrenzt. Externe Speichergeräte wie Festplatten und Solid-State-Laufwerke enthalten viel mehr Informationen, sind aber langsamer. Um eine lange Gleichung zu lösen, müssen Sie sie im Hauptspeicher ablegen, damit Sie problemlos damit arbeiten können.

In den 80er Jahren waren beide Gedächtnisarten begrenzt. „FORM wurde zu einer Zeit gebaut, als es fast keinen Arbeitsspeicher und auch keinen Festplattenspeicher gab – im Grunde gab es nichts“, sagte er Ben Ruijl, ein ehemaliger Schüler von Vermaseren und FORM-Entwickler, der jetzt Postdoktorand an der Eidgenössischen Technischen Hochschule Zürich ist. Dies stellte eine Herausforderung dar: Gleichungen waren zu lang für den Hauptspeicher. Um einen zu berechnen, musste Ihr Betriebssystem Ihre Festplatte so behandeln, als wäre sie auch Hauptspeicher. Das Betriebssystem, das nicht wusste, wie groß Ihre Gleichung werden sollte, speicherte die Daten in einer Sammlung von „Seiten“ auf der Festplatte und wechselte häufig zwischen ihnen, wenn verschiedene Teile benötigt wurden – ein ineffizienter Prozess, der als Swapping bezeichnet wird.

Dieser xkcd-Comic veranschaulicht die Situation gut.

Abbildung: xkcd.com

FORM umgeht das Austauschen und verwendet eine eigene Technik. Wenn Sie in FORM mit einer Gleichung arbeiten, weist das Programm jedem Term eine feste Menge an Speicherplatz auf der Festplatte zu. Mit dieser Technik kann die Software leichter nachverfolgen, wo sich die Teile einer Gleichung befinden. Es macht es auch einfach, diese Teile wieder in den Hauptspeicher zu bringen, wenn sie benötigt werden, ohne auf den Rest zuzugreifen.

Der Arbeitsspeicher ist seit den Anfängen von FORM gewachsen, von 128 Kilobyte RAM im Atari 130XE im Jahr 1985 auf 128 Gigabyte RAM in meinem aufgemotzten Desktop – eine millionenfache Verbesserung. Aber die von Vermaseren entwickelten Tricks bleiben entscheidend. Während Teilchenphysiker Petabytes an Daten des Large Hadron Collider durchsuchen, um nach Beweisen für neue Teilchen zu suchen, wird ihr Bedürfnis nach Präzision und damit die Länge ihrer Gleichungen immer länger.

source-114

Leave a Reply