1) Spielanalysen – der Fahrplan

Wir wollen die Spielstärke der besten Großmeister, zumindest aller (auch inoffizieller) Weltmeister der Vergangenheit, anhand ihrer gespielten Partien analysieren und daraus verschiedene Kennzahlen ableiten, um eine einheitliche Datenbasis zu schaffen, die wir für unseren Vergleich nutzen können.

Unser Ansatz, Meisterpartien von leistungsfähigen Schachprogrammen analysieren zu lassen und die daraus gewonnenen Kennzahlen als Maßstab der Spielstärke zu verwenden ist nicht neu. Im Vergleich zu den Analysen z.B. von chess.com wollen wir aber nicht nur eine einzige Kennzahl zur Bewertung heranziehen, sondern mehrere Aspekte berücksichtigen. Insbesondere wollen wir bereits bekannte Eröffnungszüge, wie sie in jedem Buch stehen, von der Wertung ausschließen. Wir wollen Können vor Wissen beurteilen!
Außerdem wollen wir alle unsere Schritte nachvollziehbar und transparent dokumentieren. Sämtliche dabei entstehenden Software-Artefakte werden über unser git-Repository zugänglich gemacht.

Als Datengrundlage verwenden wir öffentliche Partien-Datenbanken, das aktuell stärkste Schachprogramm (engl. chess engine) zur Analyse, etablierte Metriken als Maßstab und etwas SQL sowie Python-Programme zur Durchführung. Am Ende wollen wir Jupyter-Notebooks zur grafischen Veranschaulichung der Ergebnisse nutzen. Soweit der grobe Plan.

Der Plan im Einzelnen:

Datenbeschaffung
als Datenquelle für die zu untersuchenden Schachpartien verwenden wir von Lumbra’s Gigabase die OTB-Datenbank mit über 9,5 Millionen Schachpartien (Stand vom 5. 8. 2025). Die Datenbank enthält alle bekannten Welt- und Großmeister-Partien bis ins 19. Jahrhundert zurück. OTB bedeutet over the board, d.h. dass es sich um keine Online-Spiele, sondern um Partien am physischen Schachbrett handelt. Das Format dieser Datenbank ist SCID 5.0, benannt nach einer bekannten Schachdatenbank-Software.
PGN-Archiv erstellen
Wir installieren die aktuelle SCID-Software (derzeit Version 5.1), um obige Datenbank öffnen zu können. Von dort exportieren wir sämtliche darin enthaltene Partien in eine PGN-Datei, um sie im nächsten Schritt mittels eines Python-Programms in eine relationale Datenbank zu überführen. Dieser Schritt ist notwendig, da SCID keine dokumentierte Programmierschnittstelle besitzt, um mit einem eigenen Programm darauf zugreifen zu können. Außerdem wollen wir versuchen, die Qualität der gespeicherten Partien nachfolgend noch zu verbessern.
Aufbau MariaDB
Mittels der Python-Software und entsprechender python-chess Bibliothek inklusive der aktuellen Stockfish engine importieren wir alle Partien aus der zuvor erstellten PGN-Datei. Wir bereinigen diese Daten und schreiben sie in unser normalisiertes Datenmodell mitsamt dem nach jedem Zug entstandenen FEN-Stellungsbild (dazu später mehr). Eine relationale Datenbank bietet viele Vorteile wie eine standardisierte Abfragesprache zur Filterung und Sortierung von Daten, Redundanzfreiheit, schnelle indizierte Zugriffe sowie die Möglichkeit, mit speziellen Datenextrakten rasch und unkompliziert weitere Hilfstabellen aufzubauen.
Partie-Analysen
Wir nutzen etablierte Metriken oder definieren neue interessante Merkmale, um die Partien von ausgesuchten Schachmeistern daraufhin zu untersuchen. Als Analyse-Software verwenden wir Stockfish (aktuell in Version 17.1). Die gewonnenen Kennzahlen schreiben wir wieder zurück in spezielle Ergebnistabellen der Datenbank.
Ergebnis-Präsentation
Für die vergleichende Visualisierung unserer Ergebnisse nutzen wir Jupyter-Notebooks mit den bekannten Grafik- und Statistik-Paketen.

zurück…

weiter…

Das könnte dir auch gefallen

7) Wir fahren in die Oper…

5) Datenbereinigung und Datenbank-Import

10) die Analyse – Umfang und Laufzeiten

Schreibe einen Kommentar Antwort abbrechen