Die Geschichte der Skalierung in KI: Von AlexNet zu GPT-4 und darüber hinaus
18.04.2025
Zusammenfassung
Von LeNet bis GPT-4 hat KI eine zehnjährige Welle exponentiellen Wachstums erlebt. Doch angesichts steigender Kosten, begrenzter Daten und abnehmender Erträge stellt sich die Frage: Ist diese Welle nun gebrochen?
1. Einleitung
Als ich 2022 meinen ersten Prompt an die damals hochgehypte App namens ChatGPT geschickt habe, hätte ich mir nicht vorstellen können, wie dramatisch sich die KI-Landschaft verändern würde. Damals war ich fasziniert von der scheinbar magischen Fähigkeit des Modells, Text und Code zu generieren. Heute beschäftigen mich ganz andere Fragen: Hat die KI-Entwicklung ihre Grenzen erreicht? War das exponentielle Wachstum der letzten Jahre nur eine vorübergehende Phase?
Vielleicht hast du auch Schlagzeilen wie „Has AI hit a wall?" gelesen oder dich gefragt, warum OpenAI plötzlich ein Abo für 2.000 Dollar anbietet. Auf den ersten Blick wirkt diese Entwicklung widersprüchlich, wenn man bedenkt, wie sehr die Medien KI weiterhin als revolutionärste Technologie unserer Zeit preisen, während Persönlichkeiten wie Sam Altman und Dario Amodei von einer nahen Zukunft mit AGI (Artificial General Intelligence) sprechen.
Nach unzähligen Stunden mit Papern, bekannten Vorträgen und eigenen Experimenten möchte ich in diesem Artikel die bemerkenswerte Geschichte hinter den modernen KI-Modellen teilen. Die Reise ist geprägt von überraschenden Durchbrüchen, mutigen finanziellen Wetten und einer grundlegenden Erkenntnis, die die KI-Entwicklung im letzten Jahrzehnt bestimmt hat: Größer ist tatsächlich besser.
Begleite mich auf dieser Reise von den bescheidenen Anfängen neuronaler Netze hin zu den heutigen Giganten, und lass uns gemeinsam schauen, ob die Ära des einfachen Skalierens an ihre Grenzen stößt oder ob wir erst am Anfang eines noch spannenderen Kapitels stehen.
2. AlexNet - Der Ursprung der Skalierungsidee
Die grundlegenden Ideen hinter modernen KI-Durchbrüchen sind eigentlich ziemlich alt und existierten schon seit Jahrzehnten, bevor ihr wahres Potenzial entfesselt wurde.
Eines der ersten erfolgreichen neuronalen Netze hieß LeNet und wurde 1989 von Yann LeCun bei Bell Labs entwickelt. Inspiriert vom menschlichen visuellen Cortex hat er eine Convolutional-Neural-Network-Architektur (CNN) gebaut, um handgeschriebene Ziffern zu klassifizieren. Dieses innovative Modell enthielt nur eine Handvoll Parameter, fast nichts im Vergleich zu heutigen Standards. Eine entscheidende Einschränkung damals war die Rechenleistung, die sowohl extrem teuer als auch begrenzt war. Neuronale Netze mussten auf CPUs laufen, denen die parallele Verarbeitungsfähigkeit fehlte, um solche Architekturen voll auszureizen.
Inspiriert von seinem früheren Erfolg hat LeCun die Architektur weiterentwickelt. 1998 hat er die fünfte Version von LeNet (LeNet-5) veröffentlicht und deutlich bessere Ergebnisse erzielt. Während er die grundlegenden CNN-Prinzipien beibehalten hat, hat er mehrere architektonische Verfeinerungen eingeführt und das Modell auf 60.000 Parameter skaliert, was für die damalige Zeit beachtlich war. Trotz dieses Fortschritts war LeNet-5 weiterhin durch die verfügbare CPU-basierte Rechenleistung eingeschränkt.
Mit langsam wachsenden Hardware-Fähigkeiten waren die frühen 2000er eine Phase relativ stagnierenden Fortschritts bei neuronalen Netzen. In der Forschungs-Community herrschte damals die weit verbreitete Meinung, dass reines Skalieren nicht zu besseren Ergebnissen führen kann und dass der einzige Weg nach vorn darin besteht, neue Algorithmen und Architekturen zu entdecken.
2012 wurde diese Annahme widerlegt. Alex Krizhevsky, Ilya Sutskever und Geoffrey Hinton haben die renommierte ImageNet Large Scale Visual Recognition Challenge (ILSVRC) mit ihrem Modell AlexNet gewonnen und die Konkurrenz mit erstaunlichem Abstand geschlagen. Ihr Ansatz basierte nicht hauptsächlich auf neuen Algorithmen. Stattdessen haben sie die bestehende CNN-Architektur auf bis dahin undenkbare Dimensionen skaliert: 60 Millionen Parameter, was zu der Zeit undenkbar schien. In einem späteren Interview hat Ilya Sutskever ihre zentralen Erkenntnisse beschrieben: dass sich wirklich tiefe neuronale Netze mit vielen Schichten end-to-end per Backpropagation trainieren lassen, und dass Graphics Processing Units (GPUs), die bis dahin hauptsächlich für Gaming genutzt wurden, die Rechenbeschränkungen überwinden könnten, die das Training neuronaler Netze bislang ausgebremst hatten. Für mich selbst war die größte Überraschung, dass ein weiterer Schlüsselpunkt für sie war, dass Krizhevsky hochgradig optimierten CUDA-Code geschrieben hat, der das Training auf GPUs ermöglichte, was das gesamte Feld bis heute revolutioniert hat.
So wurde AlexNet zum ersten Beweis für die These, dass das Skalieren von KI zu deutlich besseren Ergebnissen führt. Eine Idee, die die Zukunft der KI prägen sollte.
3. GPT - Skalierung trifft auf Natural Language
Der Transformer
Bis 2017 wurde Natural Language Processing hauptsächlich mit Recurrent Neural Networks (RNNs) gemacht, einer Architektur mit einem Hidden State, der Informationen sequenziell speichert.
2017 hat ein Team von Forschern bei Google Brain und Google Research den Transformer in ihrem Paper „Attention is all you need" veröffentlicht, eine neue Architektur, die ursprünglich für maschinelle Übersetzung entworfen war. Sie besteht aus zwei Teilen: einem Encoder, der Text in einen hochdimensionalen Raum überführt, und einem Decoder, der diese hochdimensionale Repräsentation nutzt, um das nächste Token vorherzusagen.
Die Stärke der Transformer-Architektur liegt in mehreren wichtigen Vorteilen:
Sie setzt stark auf den Self-Attention-Mechanismus und kann so die Wichtigkeit verschiedener Wörter im Kontext gewichten
Sie ist im Gegensatz zu RNNs nicht rekurrent, dadurch flacher und leichter zu optimieren
Sie parallelisiert sehr gut und läuft damit deutlich schneller auf GPUs
Sie erreicht bessere Ergebnisse mit weniger Rechenaufwand
Diese architektonische Innovation hat den Grundstein für alle modernen Large Language Models gelegt.
GPT-1
Ein Jahr später, 2018, haben Forscher bei OpenAI GPT-1 (Generative Pretrained Transformer) veröffentlicht, ein Modell, das nur auf dem Decoder-Teil der ursprünglichen Transformer-Architektur basiert. Die Grundidee war, die Fähigkeit des Decoders zur Vorhersage des nächsten Tokens in einer Sequenz zu nutzen, um basierend auf einem gegebenen Input komplett neuen Text zu erzeugen. GPT-1 hatte rund 117 Millionen Parameter, was für die damalige Zeit substanziell war, und wurde auf etwa 40 Milliarden Tokens Textdaten trainiert. Das Team unter Leitung von Ilya Sutskever (der schon Teil des AlexNet-Teams war) hat stark auf die frühere Idee gesetzt, dass Skalierung zu besseren Ergebnissen führt, anstatt sich auf komplexe architektonische Innovationen zu konzentrieren. GPT-1 hat für seine Zeit und Größe beeindruckend abgeschnitten und erste Anzeichen gezeigt, dass der Skalierungsansatz, der die Computer Vision revolutioniert hatte, auch im Bereich Natural Language Processing erfolgreich angewendet werden kann, was den Beginn der Pretraining-Ära in NLP markierte.
GPT-2
Wieder ein Jahr später, 2019, hat das Team bei OpenAI die nächste Version der GPT-Familie veröffentlicht: GPT-2. Anders als der Vorgänger wurde diese Version nicht als ein einzelnes Modell veröffentlicht, sondern als Set von Modellen verschiedener Größen, von 124 Millionen bis 1,5 Milliarden Parametern. Diese Modelle haben fast die gleiche Architektur wie GPT-1 beibehalten, wurden aber massiv hochskaliert.
GPT-2 hat die Idee, dass Skalierung zu besseren Ergebnissen führt, über drei zentrale Dimensionen weiter bestätigt: mehr Parameter, mehr und qualitativ bessere Daten, und mehr Rechenleistung. Die Ergebnisse waren beeindruckend. GPT-2 hat eine deutlich bessere Performance bei der Texterzeugung gezeigt, verbesserte Fähigkeiten beim Lösen von „Zero-Shot"-Aufgaben (Aufgaben, für die es nicht explizit trainiert war) demonstriert und konnte ein signifikant größeres Kontextfenster verarbeiten, wodurch es Kohärenz über längere Texte halten konnte. Trotz Anerkennung von einigen KI-Forschern hat das Modell wenig öffentliche Aufmerksamkeit bekommen.
GPT-3
2020 hat OpenAI GPT-3 veröffentlicht, eine dramatisch hochskalierte Version ihrer GPT-Architektur. Basierend auf ihrem Forschungspaper „Scaling Laws for Neural Language Models", das wir im nächsten Kapitel behandeln, ist das Team ein massives finanzielles Risiko von rund 4,6 Millionen USD eingegangen, um das Modell auf 175 Milliarden Parameter zu skalieren, mehr als 100 Mal größer als die größte Version von GPT-2. Außerdem haben sie einen massiv erweiterten Datensatz mit Hunderten Milliarden Tokens verwendet.
Die Ergebnisse waren bemerkenswert. Über die Verbesserung bestehender Metriken hinaus hat GPT-3 überraschend neue Fähigkeiten entwickelt, die in kleineren Modellen nicht zu beobachten waren. Am bedeutsamsten waren die beeindruckenden Few-Shot-Learning-Fähigkeiten, also die Fähigkeit, komplett neue Aufgaben zu lösen, nachdem es nur wenige Beispiele gesehen hat, ohne dass Parameter angepasst werden mussten. Das ist ziemlich erstaunlich, wenn man kurz darüber nachdenkt: Allein das Hochskalieren des Modells hat zu einer ganz neuen Bandbreite an Fähigkeiten geführt.
GPT-4
Mit der erfolgreichen Veröffentlichung von ChatGPT im Jahr 2022 hatte OpenAI bereits gezeigt, dass ihre GPT-3-Modelle eine gute Grundlage für ein erfolgreiches Consumer-Produkt sind. Im Frühjahr 2023, ein paar Monate nach dem ChatGPT-Moment, haben sie GPT-4 veröffentlicht, ihr bis dahin fortschrittlichstes Modell, das die Fähigkeiten von ChatGPT weiter ausgebaut hat.
Ich persönlich habe keinen großen Unterschied bemerkt. Laut mehreren Power-Usern waren die Verbesserungen jedoch beeindruckend. GPT-4 hat deutlich höhere Verlässlichkeit bei komplexen Aufgaben gezeigt, spürbar weniger Halluzinationen produziert und zum ersten Mal multimodale Features eingeführt, die es Nutzern ermöglichen, neben Text auch Bilder als Input zu liefern. Das war ein signifikanter Sprung sowohl in der Fähigkeit als auch in der Nutzbarkeit.
Dieser Release hat auch einen Wandel in OpenAIs Umgang mit Transparenz markiert. Anders als bei vorherigen Iterationen, bei denen das Unternehmen detaillierte Forschungspaper veröffentlicht hat, kam GPT-4 mit nahezu keinen Informationen zum Modell und dem Training. Dieser Mangel an Transparenz kommt vermutlich von OpenAIs Übergang von einer forschungsorientierten Organisation hin zu einem kommerziellen Unternehmen. Angesichts der enormen Nachfrage nach ihren Produkten und der wachsenden Konkurrenz im KI-Bereich scheint das Unternehmen eine strategische Entscheidung getroffen zu haben, sein geistiges Eigentum und seinen Wettbewerbsvorteil zu schützen, indem es technische Details geheim hält.
4. Die Scaling Laws
Wie ich in der Geschichte zu GPT-3 erwähnt habe, war einer der Schlüsselgründe für das finanzielle Risiko der Forscher die Theorie der Scaling Laws. In diesem Abschnitt schauen wir uns genauer an, was diese Gesetzmäßigkeiten zeigen.
Seit den frühen Tagen von GPT war den Forschern klar, dass Modellgröße, Datensatzgröße und der Rechenaufwand für das Training die Hauptfaktoren hinter dem Erfolg sind. Indem sie diese drei Faktoren über alle bisher trainierten Modelle hinweg analysiert haben, sind den Forschern faszinierende Muster aufgefallen. Diese Beobachtungen haben 2020 zur Veröffentlichung des Papers „Scaling Laws for Neural Language Models" von OpenAI geführt, in dem sie ihre Erkenntnisse als empirische Gesetze geteilt haben.
Die zentrale Frage hinter diesen Untersuchungen war, ob sich Muster finden lassen, die die Performance viel größerer Modelle vorhersagen können, bevor man sie tatsächlich trainiert. Basierend auf diesen Gesetzen wurde die Entscheidung getroffen, in das Training des riesigen GPT-3-Modells zu investieren.
Das Paper hat gezeigt, dass die Modellleistung im Wesentlichen von drei Variablen abhängt:
Die Anzahl der Parameter (Größe des Modells)
Die Menge der Trainingsdaten (gemessen in Tokens)
Die Menge an Compute, die für das Training verwendet wird
Jede dieser Variablen korreliert auf vorhersagbare Weise mit der Modellleistung, vorausgesetzt, sie wird nicht durch die anderen Variablen begrenzt. Die Leistung wird über den Test Loss gemessen (wie genau das Modell das nächste Token in einer Sequenz vorhersagt; niedriger ist besser).
Was diese Gesetze besonders mächtig macht, ist, dass sie überraschend saubere Potenzgesetz-Beziehungen folgen. Auf logarithmischen Skalen, wie in den Graphen oben, bilden sie nahezu gerade Linien. Wenn du einen dieser Faktoren erhöhst, folgt die Verbesserung der Performance einem vorhersagbaren mathematischen Muster.
Der linke Graph zeigt, wie sich die Performance mit mehr Compute verbessert. Der mittlere Graph zeigt die Beziehung zwischen Datensatzgröße und Performance. Der rechte Graph zeigt, wie sich eine höhere Parameteranzahl auf die Performance auswirkt.
Diese empirischen Gesetze zeigten klar in eine Richtung: Skaliere Modellgröße, Trainingsdaten und Rechenressourcen im richtigen Verhältnis hoch, und du bekommst vorhersagbar bessere Modelle. Das hat OpenAI die Zuversicht gegeben, die enorme Investition in GPT-3 zu wagen, mit einer bemerkenswerten Gewissheit darüber, welche Performance zu erwarten ist. Im Rückblick haut es mich um, wie vorhersagbar dieser Fortschritt war, auch wenn die Scaling Laws damals nur eine Beobachtung waren und das Training von GPT-3 ein großes Risiko.
5. Ist Scaling an eine Wand gestoßen?
Trotz des unglaublichen Erfolgs des einfachen Skalierungsansatzes gibt es wachsende Hinweise darauf, dass er irgendwann an seine Grenzen stoßen wird. Mehrere Einschränkungen sind beim weiteren Skalieren sichtbar geworden.
Die offensichtlichste Einschränkung, die schon bei GPT-3 ein großes Risiko war, ist das kostenintensive Training. Trainingskosten sind auf bisher ungekannte Niveaus geschossen. GPT-4 soll im Training über 100 Millionen Dollar gekostet haben. Diese Kostenexplosion wird von einigen Schlüsselfaktoren angetrieben. Zum einen ist die Nachfrage nach High-End-GPUs in die Höhe geschossen und mit ihr der Preis, was NVIDIA, das beim Thema KI-Chips eine Art Monopol hat, kurzzeitig zum wertvollsten Unternehmen der Welt gemacht hat. Als neue Wettbewerber das Potenzial von KI erkannt haben, fingen mehr Firmen an, solche Modelle zu trainieren, und ein Wettrüsten begann. Heute ist das Risiko real, dass während eine Firma ein neues Modell trainiert, eine andere ein deutlich besseres veröffentlichen kann, was die anderen obsolet macht.
Rechenressourcen sind technisch zwar nicht durch eine harte Wand begrenzt, die Ökonomie wird mit zunehmender Skalierung aber immer ungünstiger. Mit der breiten Verbreitung von KI-Services geht inzwischen ein signifikanter Anteil der Rechenressourcen in die Inferenz bestehender Modelle, statt in das Training neuer. Diese Verschiebung schränkt die für das Skalieren neuer Modelle verfügbaren Ressourcen weiter ein und verringert den Return on Investment deutlich.
Die vielleicht grundlegendste Grenze ist die Verfügbarkeit von Trainingsdaten. Modelle wie GPT-4 haben bereits einen Großteil des hochwertigen Texts im Internet verarbeitet, und wir nähern uns einer Datenwand. Das Angebot an menschlich geschriebenem Text ist begrenzt. Man könnte daran denken, einfach synthetische Daten fürs Training zu nutzen, aber dabei besteht das Risiko, bestehende Verzerrungen und Halluzinationen zu übernehmen, was das gesamte Modell vergiften kann. Laut einem Vortrag von Ilya Sutskever bei NeurIPS 2024 sind die Daten der limitierende Faktor der Pretraining-Ära.
Die Scaling Laws selbst zeigen ebenfalls kritische Anzeichen: Die Performance verbessert sich zwar weiterhin mit der Skalierung, die Rate der Verbesserung sinkt jedoch. Die logarithmische Natur dieser Verbesserungen bedeutet, dass eine Verdopplung von Parametern oder Trainingsdaten immer kleinere Zugewinne bringt. Eine mathematische Realität, die sich nicht überwinden lässt.
Eine weitere weiche, aber wichtige Grenze ist, dass sich der Fokus auf Test-Loss-Optimierung zunehmend von der Praxistauglichkeit entkoppelt hat. Die Messung über Test Loss und diverse Benchmarks deckt sich nicht mit den realen Anwendungen, was zu einer grundlegenden Frage führt: Warum stecken wir so viele Ressourcen darein, den besten Score in einem Benchmark zu bekommen, wenn das in realen Aufgaben nicht besser ist?
Das Skalierungsparadigma ist nicht an eine harte technische Wand gestoßen, eher an eine ökonomische und praktische. Während KI von Forschung zu Produkt übergeht, weicht der reine Skalierungsansatz einer differenzierteren Strategie, die Größe mit Effizienz, Qualität und praktischem Nutzen ausbalanciert.
6. Skalierung wird sich verändern
Ist Skalierung also am Ende? Weit gefehlt. Die KI-Forschungslandschaft entwickelt sich kontinuierlich weiter und findet neue Wege nach vorn, auch wenn die klassischen Skalierungsansätze an Grenzen stoßen. Was wir sehen, ist die Transformation der Skalierung, nicht ihr Ende.
Wichtig zu erwähnen ist, dass wir bisher hauptsächlich über die Pretraining-Phase der Modellentwicklung gesprochen haben. Moderne KI-Systeme durchlaufen mehrere Trainingsstufen: Pre-Training, Supervised Fine-Tuning und RLHF (Reinforcement Learning from Human Feedback). Jede Stufe bietet eigene Möglichkeiten für Innovation und Optimierung.
Aus meiner Sicht ist einer der vielversprechendsten Ansätze multimodales Lernen, also das Einbeziehen von Bildern, Audio und Video in den Datensatz. Dieser Ansatz könnte die bestehenden Grenzen verschieben und zu einem allgemeineren Modell führen, das die reale Welt tiefer verstehen kann. Die Herausforderung ist dabei rechnerisch. Insbesondere das Verarbeiten von Videodaten erfordert deutlich mehr Ressourcen als reiner Text, hat aber das Potenzial, die KI-Welt erneut umzugestalten.
Eine weitere innovative Richtung ist die Verlagerung der Skalierungsbemühungen vom Training hin zur Inferenz. Statt nur größere Modelle zu bauen, entwickeln Forscher Techniken, die es Modellen erlauben, mehr Zeit und Compute aufzuwenden, um über ein Problem „nachzudenken". Dieser Ansatz führt zu neuen Fähigkeiten wie beeindruckenden Reasoning-Schritten und dem Verifizieren der eigenen Ausgaben. Die o1/o3/o4-Modelle von OpenAI zeigen das Potenzial dieses Ansatzes und demonstrieren bemerkenswerte neue Fähigkeiten durch erweiterte Inferenz-Zeit-Berechnung statt durch reine Parameteranzahl.
Diese Ansätze ermöglichen effektives Skalieren ohne einen linearen Anstieg des Rechenbedarfs.
Das Skalierungsparadigma entwickelt sich also weiter, statt zu enden. Die grundlegende Erkenntnis, dass größere Modelle mit mehr Daten und mehr Rechenleistung zu besserer Performance führen, gilt weiterhin, während die Umsetzung differenzierter und ausgefeilter wird.
Wenn Modelle in verschiedenen Domänen menschliches Niveau erreichen, verschiebt sich der Fokus von reiner Fähigkeit hin zu Verlässlichkeit, Effizienz und spezialisierter Expertise. Die Zukunft der KI-Skalierung wird sich vermutlich nicht mehr nur an Parameterzahlen messen lassen, sondern an der intelligenten Verteilung von Rechenressourcen über Training, Fine-Tuning und Inferenz.
Die Skalierungsrevolution ist nicht an eine Wand gestoßen. Sie schlägt nur einen interessanteren und komplexeren Weg ein. Während neue Innovationen und Techniken entstehen, werden viele dieser Ideen durch Hochskalieren weiter verbessert werden.
7. Fazit
Aus meiner Sicht ist die Geschichte der Skalierung in künstlicher Intelligenz eines der bemerkenswertesten Kapitel der Technikgeschichte. Was 2012 mit der Verschmelzung von GPUs und tiefen neuronalen Netzen begann, hat sich durch die Transformer-Revolution entwickelt und in eine neue Ära von Modellen mit beeindruckenden Fähigkeiten geführt. Durch die gesamte Reise zieht sich ein grundlegendes Prinzip: Skalierung funktioniert.
Während KI von einem Forschungsprojekt für spezialisierte Anwendungen zu einer allgemeinen Consumer-Technologie wird, hat sich die Ökonomie der Skalierung grundlegend verändert. Unternehmen müssen ihre Entwicklung zwischen Leistungsfähigkeit und finanzieller Tragfähigkeit ausbalancieren. Diese Verschiebung markiert nicht das Ende des Skalierungsparadigmas, sondern eine Transformation in einen differenzierteren Ansatz.
Die Skalierungsära hat eine Industrie geschaffen, in der die Entwicklung von Frontier-Modellen enorme Kapitalinvestitionen erfordert, oft hunderte Millionen Dollar. Der Umsatz, der diese Unternehmen trägt, kommt jedoch vor allem aus der Inferenz, also dem Bereitstellen dieser Modelle für Nutzer. Diese ökonomische Realität hat die Prioritäten naturgemäß in Richtung Effizienz und Optimierung verschoben, statt einfach die größtmöglichen Basis-Modelle zu bauen.
Das heißt nicht, dass die Skalierungsära vorbei ist. Sie verschiebt sich zu einem gemessenen und vielschichtigeren Vorgehen als dem exponentiellen Wachstum, das wir zwischen GPT-1 und GPT-4 gesehen haben. Skalierung bedeutet heute, sich auf architektonische Effizienz, Inferenz-Optimierung, multimodale Fähigkeiten und spezialisierte Expertise zu konzentrieren, zusätzlich zu mehr Parametern und Daten.
Wenn wir in die Zukunft schauen, werden die Unternehmen und Forscher Erfolg haben, die verstanden haben, dass echtes Skalieren darum geht, Modelle besser, effizienter und alltagstauglicher zu machen. Anthropic ist ein gutes Beispiel für diesen Trend. Sie haben gemerkt, dass ein signifikanter Teil der Nutzung ihrer Claude-Modelle von Software-Engineers kommt, also haben sie sich entschieden, ihr Sonnet-Modell speziell für Anwendungsfälle in diesem Bereich zu optimieren, was bemerkenswert gut funktioniert hat.
Wenn du tiefer in die Frage einsteigen willst, warum Skalierung überhaupt funktioniert, kann ich das neue Buch des Podcasters Dwarkesh Patel empfehlen: The Scaling Era: An Oral History of AI, 2019–2025.
Eine Sache noch: Selbst die klügsten Köpfe unserer Zeit können die Zukunft nicht zu 100% vorhersagen.
Wenn du bis hier gelesen hast, danke für deine wertvolle Aufmerksamkeit.