Langzeitgedächtnis für KI: Titans und MIRAS zeigen den Weg

Tom Brigl –

Veröffentlicht:

07.03.2026,

Letzte Aktualisierung:

07.03.2026

Ein neuer Schritt für das Langzeitgedächtnis der KI

Wenn du dich schon einmal gefragt hast, warum große Sprachmodelle oder andere KI-Systeme zwar riesige Datenmengen verarbeiten können, aber scheinbar schon nach ein paar Seiten „vergessen“, worum es ging – hier kommt eine spannende Antwort. Google Research hat mit den Konzepten Titans und MIRAS zwei neue Forschungsarbeiten vorgestellt, die genau dieses Problem angehen. Ziel ist es, Modellen beizubringen, wie sie über lange Zeiträume relevante Informationen behalten und sinnvoll priorisieren können – also gewissermaßen ein besseres Gedächtnis zu entwickeln.

Was Titans besonders macht

Die Titans-Architektur ist eine neue Modellfamilie, die einen Mechanismus besitzt, den Google als Long-Term Memory Modul beschreibt. Dieses Modul lernt dynamisch, während das Modell neue Daten verarbeitet. Kern dieses Prozesses ist der sogenannte „surprise metric“ – ein mathematischer Indikator, der bemerkt, wenn etwas Unerwartetes passiert. Im Grunde sagt er dem System: „Moment, das war neu oder wichtig – das musst du dir merken!“

Die Idee wirkt fast menschlich. Stell dir vor, du liest einen langen Roman: Du merkst dir nicht jedes Detail, aber wenn eine Figur plötzlich etwas tut, das gar nicht zu ihr passt, bleibt es im Gedächtnis hängen. Genau so arbeitet dieser Surprise-Mechanismus – er signalisiert, wo es Sinn ergibt, genauer hinzuschauen.

Wie Momentum und Vergessen helfen

Neben dieser Überraschungskomponente verwendet Titans ein Konzept, das Entwickler als „Momentum“ bezeichnen. Es sorgt dafür, dass das Modell nicht nur einzelne überraschende Details speichert, sondern den gesamten relevanten Kontext in der Nähe dieser Ereignisse beachtet. So entsteht eine Art Fokuszone, die sich kurzzeitig stabilisiert – ähnlich wie du dich vielleicht nach einer spannenden Wendung ein paar Seiten besonders gut erinnerst.

Doch was passiert, wenn der Speicher irgendwann voll ist? Dafür gibt es einen eingebauten adaptiven Vergessensmechanismus. Er lässt unwichtige oder veraltete Informationen langsam verblassen, um Speicherplatz für Neues freizumachen. Diese Kombination aus Aufmerksamkeit, Momentum und Vergessen sorgt dafür, dass Titans aktuelle Informationen verarbeitet, ohne das große Ganze zu verlieren.

In meinen Augen ist das genau der Schritt, der bisher in vielen Modellen gefehlt hat. Sie konnten rechnen, sprechen und schreiben – aber eben nicht wirklich „merken“.

MIRAS: Das Framework dahinter

Während Titans eine konkrete Architektur ist, bildet MIRAS (Memory, Inference, Retention, and Association Systems) den übergeordneten theoretischen Rahmen. Es handelt sich um ein flexibles Systemdesign, das beschreibt, wie Gedächtnis in Sequenzmodellen strukturiert werden kann. Statt einfach „mehr Schichten“ zu bauen, geht es darum, bewusst zu entscheiden, welche Art von Gedächtnis ein Modell bekommen soll.

MIRAS betrachtet ein Modell als eine Art assoziatives Gedächtnis – wie das menschliche Gehirn, das Zusammenhänge zwischen Mustern erkennt. Die Forscher benennen vier Kernentscheidungen, die nötig sind, um so ein Modell zu bauen:

Die Struktur des Gedächtnisses: Ob das System mit einfachen Vektoren oder komplexen neuronalen Netzwerken arbeitet. Titans zum Beispiel nutzt tief verschachtelte MLP-Schichten.
Der Aufmerksamkeitsbias: Welches Signal entscheidet, was wichtig genug ist, um gespeichert zu werden.
Die Balance zwischen Stabilität und Lernen: Wie stark neue Informationen frühere überschreiben.
Das Lernverfahren selbst: Meist ein Optimierungsprozess wie Gradient Descent, mit dem das Modell auch während der Laufzeit weiter dazulernt.

MIRAS liefert damit eine Art Baukasten für zukünftige Modelle, die über reine Mustererkennung hinausgehen sollen – ideal für Anwendungen, in denen langfristige Zusammenhänge entscheidend sind, etwa bei wissenschaftlichen Analysen, komplexen Dialogsystemen oder automatisierten Recherchen.

Wo heute noch das Problem liegt

Moderne KI ist großartig im Momentanbild – sie sieht, analysiert, reagiert. Doch sobald man sie mit zu viel Input füttert, verliert sie schnell den Überblick. Zwei klassische Ansätze gibt es bisher:

Das Aufmerksamkeitsfenster: Das Modell schaut immer wieder zurück auf frühere Tokens (also Wörter oder Daten). Das ist präzise, aber teuer, da es exponentiell mehr Rechenleistung braucht, je länger der Text wird.
Kompression: Statt alles zu behalten, fasst das Modell alte Informationen zusammen. Das spart Rechenzeit, kostet aber Kontext – irgendwann wird aus der Geschichte nur noch eine vage Zusammenfassung.

Beide Methoden stoßen früher oder später an Grenzen. Die Größe des Modells spielt dabei weniger eine Rolle als seine Fähigkeit, selektiv zu speichern. Genau hier setzt Titans an: Es entscheidet aktiv, was behalten und was vergessen werden soll – und zwar im laufenden Betrieb.

Warum zwei getrennte Studien?

Wenn du dir die Entwicklung ansiehst, ergibt es Sinn, dass Google sie aufteilt. Titans dient der praktischen Demonstration – ein Beweis, dass ein Modell tatsächlich länger „denken“ kann. MIRAS dagegen liefert den theoretischen Unterbau, um künftig weitere Varianten solcher Modelle systematisch zu entwerfen. Die eine Arbeit zeigt also das Wie, die andere das Warum.

Titans in der Praxis – eine neue Gedächtnisebene

Das Titans-Modell erweitert klassische Architekturen um ein echtes Langzeitgedächtnis. Statt kontinuierlich alles neu durchzurechnen, merkt es sich selektiv das Wichtige und verwendet dieses Wissen, um neue Eingaben einzuordnen. Besonders beeindruckend ist, dass dieses Gedächtnis nicht starr ist – es lernt mit.

Die Umsetzung erlaubt es, extrem lange Texte oder Datensequenzen zu verarbeiten, ohne dass Rechenzeit explodiert oder die Genauigkeit leidet. Google betont, dass Titans nicht als Ersatz, sondern als Erweiterung gedacht ist – bestehende Modelle können das Modul also potenziell integrieren.

Eine Folge davon ist, dass Systeme künftig „Erinnerungen“ über Wochen oder Monate behalten könnten – ein gewaltiger Schritt für Anwendungen wie persönliche Assistenten oder Forschungsplattformen.

MIRAS – die Theorie dahinter

Während Titans die praktische Seite abdeckt, hilft MIRAS Entwicklern, besser zu verstehen, welche Designentscheidungen ein bestimmtes Gedächtnisverhalten erzeugen. Statt unzählige neue Architekturen zu testen, kann man mit MIRAS gezielt planen, welche Art von Erinnerung ein Modell braucht und wie sie sich anpassen soll.

Das Framework erinnert mich fast an die kognitive Psychologie: Es geht um die Balance zwischen Lernen und Stabilität. Zu schnelles Lernen führt zu Chaos – zu viel Stabilität macht stur. MIRAS erlaubt es, diesen Regler bewusst zu steuern.

Wie gut funktioniert das wirklich?

Die Forscher haben ihre Modelle auf extrem langen Kontextaufgaben getestet – Szenarien, in denen klassische Transformer schon lange scheitern. Dabei zeigte Titans:

Verarbeitung von über 2 Millionen Tokens, ohne Genauigkeit zu verlieren.
Auf Benchmarks wie BABILong, die komplexe logische Verknüpfungen über riesige Texte prüfen, übertraf Titans deutlich größere Modelle – darunter GPT‑4.
Effizienzvorteil: Weniger Parameter, geringerer Speicherverbrauch, aber bessere Ergebnisse.

Das ist bemerkenswert, weil es zeigt, dass Leistung nicht allein vom Modellumfang abhängt, sondern von dessen internem Gedächtnisaufbau.

Auch die MIRAS-Experimente belegen, dass diese Prinzipien generalisierbar sind. Mehrere Varianten, basierend auf denselben vier Designentscheidungen, erzielten konsistent hohe Ergebnisse auf unterschiedlichen Aufgaben. Das deutet auf einen echten Paradigmenwechsel hin.

Was die Forscher selbst sagen

Im Fazit schreiben die Beteiligten, Titans übertreffe Transformer vor allem bei langen Kontexten. MIRAS gehe darüber hinaus, indem es erkläre, warum diese Fortschritte entstehen und wie man sie gezielt nachbauen kann. Das sei der Schritt hin zu „Architekturen, die ihr eigenes Gedächtnis managen“.

Solche Modelle könnten künftig eigenständig entscheiden, was langfristig relevant ist – ohne menschliche Nachjustierung oder starre Parameter. Das wäre fast so, als gäbe man der KI eine Art metakognitives Bewusstsein für ihre eigenen Gedächtnisvorgänge.

Was das für die Zukunft bedeutet

Aus meiner Sicht verändern Titans und MIRAS langfristig unser Verständnis davon, was KI leisten kann. Bisher drehte sich vieles um Größe: mehr Parameter, mehr Training, mehr Daten. Doch die eigentliche Grenze liegt nicht bei der Rechenleistung, sondern bei der Gedächtnisverwaltung.

Mit diesen neuen Systemen könnte ein Modell zum Beispiel ein komplettes Forschungsprojekt begleiten, sich an frühere Hypothesen erinnern, frühere Fehler vermeiden oder individuelle Arbeitsweisen erlernen – ohne dass man es jedes Mal neu trainieren muss.

Natürlich stellt das auch neue Fragen: Wie kontrolliert man ein System, das so viel behalten kann? Und wie stellt man sicher, dass es nichts Falsches „lernt“? Die Forscher deuten an, dass MIRAS hier eine Grundlage bietet, um genau solche Steuermechanismen einzubauen.

Meine Einschätzung

Ich habe in den letzten Jahren viele Entwicklungen im Bereich generativer Modelle verfolgt – von GPT über PaLM bis Gemini. Doch hier spürt man etwas, das sich anders anfühlt: Es geht nicht nur um mehr Rechenpower, sondern um Struktur, Strategie und Langzeitverstehen. Mir persönlich gefällt, dass Google mit diesen Veröffentlichungen nicht bloß ein fertiges Produkt präsentiert, sondern auch den theoretischen Rahmen offenlegt. Das schafft Raum für echte Forschungsgemeinschaft.

Was bleibt, ist das zukünftige Bild von KI: Systeme, die nicht nur reagieren, sondern sich kontextbewusst erinnern. Vielleicht bedeutet das eines Tages, dass dein KI‑Assistent nicht nur weiß, was du gestern geschrieben hast, sondern versteht, warum es dir wichtig war.

Fazit

Mit Titans und MIRAS zeichnet sich ein neuer Weg ab: Statt Rechenstärke weiter unendlich zu steigern, wird das Gedächtnis zum entscheidenden Faktor. Titans zeigt, wie man Modelle praktisch dazu befähigt, Informationen bewusst zu speichern und zu vergessen. MIRAS liefert die theoretische Landkarte, auf der zukünftige Systeme entworfen werden können.

Gemeinsam bilden sie den Schritt hin zu einer KI, die sich an mehr erinnert als nur an die letzten paar Absätze. Eine KI, die versteht, was „Kontext“ über Stunden, Tage oder Aufgaben hinweg wirklich bedeutet – und damit ein Stück näherkommt an dem, was wir unter intelligentem Denken verstehen.

Tom Brigl

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Ut elit tellus, luctus nec ullamcorper mattis, pulvinar dapibus leo.

Das könnte Dich ebenfalls interessieren:

Google Spam Update Juni 2026 Der Rollout war rekordverdächtig schnell

News

30.06.2026

Nach nur rund zwei Tagen war das Google Spam Update vom Juni 2026 bereits vollständig ausgerollt. Gestartet ist es am Mittwoch, dem 24....

Search Console Seitenindexierung hängt zwei Wochen im Rückstand

News

30.06.2026

Der Bericht zur Seitenindexierung in der Google Search Console hängt aktuell deutlich hinterher: Er steht offenbar noch auf dem 11. Juni 2026 und...

So werden KI Impressionen gezählt Google zeigt nur sichtbare Links

News

29.06.2026

Wenn du deine Sichtbarkeit in der Google-Suche über die neuen KI-Funktionen beobachtest, kommt es auf ein ziemlich schlichtes, aber wichtiges Detail an: Eine...

Google Search Console KI Steuerung einschließen oder ausschließen

News

29.06.2026

Wenn du eine Website betreibst, Inhalte veröffentlichst oder für SEO verantwortlich bist, kommst du an Googles generativen Suchfunktionen kaum noch vorbei. Gemeint sind...

Found by Google Produkte stoppen Pausieren und data nosnippet nutzen

News

26.06.2026

Wenn du mit dem Google Merchant Center arbeitest, kennst du wahrscheinlich diese etwas unangenehme Situation: Du pflegst deinen Produktfeed sauber, kontrollierst Titel, Preise,...

Google Spam Update Juni 2026 wichtige SEO Warnung jetzt prüfen

News

26.06.2026

Google hat das Spam Update vom Juni 2026 ausgerollt, und wenn du im SEO-Bereich arbeitest, solltest du die nächsten Tage nicht völlig entspannt...