DeepSeek-Update: Was sich geändert hat, was neu ist und warum es wichtig ist

Im Februar 2026 brachte das chinesische KI-Startup DeepSeek ein bedeutendes Update für seine Online-Anwendung und Weboberfläche heraus, was auf den Schwung in Richtung des Releases des Next-Generation-Modells, DeepSeek V4, hindeutet. Zwar erscheint das Update vor dem vollständigen V4-Modell, doch es hat bereits aufgrund von Änderungen am Interaktionsverhalten, den Langkontext-Fähigkeiten und vorbereitenden Tests für zukünftiges Potenzial Diskussionen unter Nutzern und Branchenbeobachtern ausgelöst.

DeepSeek trat mit seinen früheren Varianten — insbesondere DeepSeek V3.2 und DeepSeek–R1 — auf die Weltbühne und kombinierte hohe Aufgabenleistung mit kosteneffizienter Skalierbarkeit. Die R1-Veröffentlichung erregte Anfang 2025 besonders internationale Aufmerksamkeit, weil sie die globalen Märkte erschütterte und die Kursentwicklung von Wettbewerberaktien nach unten drückte — ein Beleg für das disruptive Potenzial von DeepSeek.

Was genau hat sich im jüngsten DeepSeek-Update geändert?

Welche Version ist das und was hat sich geändert?

Das jüngste Update betrifft die Online-Anwendung und Weboberfläche von DeepSeek, jedoch ausdrücklich noch nicht das API-Modell. Laut mehreren Quellen:

Das aktuelle Anwendungsupdate lässt sich am besten als Langkontext-Strukturtest beschreiben — es ermöglicht Web- und App-Nutzern den Zugriff auf eine Kontextunterstützung von bis zu 1 Million Token. Dies ist ein signifikanter Sprung gegenüber dem Kontextfenster von ~128 K in DeepSeek V3.2s API-Angebot.
Das Upgrade erhöht den effektiven Speicher für eine einzelne Unterhaltung oder Aufgabe und erlaubt dem Modell, wesentlich mehr Informationen zu behalten und zu verarbeiten. Berichten zufolge entspricht dies effektiv dem 10× der bisherigen Speicherkapazität — ein Durchbruch für mehrstufiges und langlaufendes Reasoning.
Hinsichtlich der Versionsbezeichnung deuten die meisten öffentlichen Signale darauf hin, dass es sich um einen technischen Vorstoß vor V4 handelt — noch nicht die formale DeepSeek V4-Veröffentlichung, aber eine klare Vorbereitung darauf.

Unter der Haube: Was treibt die Veränderung an?

Hinter den Kulissen zeigen Ergänzungen im GitHub-Repository von DeepSeek, gekennzeichnet mit einer internen Kennung („MODEL1“), eine neue Modellarchitektur, die sich von V3.2 unterscheidet. Die Codestruktur verweist auf Speicheroptimierungstechniken, Verbesserungen bei der FP8-Unterstützung und Kompatibilität mit neueren GPU-Architekturen von Nvidia — alles Kernkomponenten, die in DeepSeek V4 erwartet werden.

Zudem hat DeepSeek Forschung zu „Engram“ veröffentlicht, einem Memory-Lookup-Modul, das neu denkt, wie große Sprachmodelle lange Kontexte und kritische Fakten verwalten. Engram scheint als grundlegende Technologie für die nächste Generation positioniert zu sein — möglicherweise die treibende Kraft hinter den erweiterten Speicherfähigkeiten von DeepSeek V4.

Reaktionen der Nutzer

Der Rollout hat eine breite Palette an Reaktionen ausgelöst:

Einerseits sind viele Nutzer begeistert von der Kontexterweiterung und ihrem Potenzial für tiefere Interaktionen und komplexere Problemlösungen.
Andererseits haben zahlreiche Nutzer öffentlich Kommentare zu Änderungen im Ton und im Konversationsstil abgegeben und die Antworten als weniger ansprechend, weniger empathisch oder schlicht „kühler“ beschrieben — was zu viralen Diskussionen in sozialen Medien führte.

Diese Divergenz unterstreicht eine wichtige Realität der KI-Bereitstellung: Aufrüstungen der technischen Fähigkeiten können die Nutzererfahrung auf unerwartete Weise umgestalten und erfordern iterative Verfeinerung vor der finalen Veröffentlichung.

Was sind die wichtigsten Merkmale dieses Updates?

1. Massive Kontext-Erweiterung

Die Unterstützung von bis zu 1 Million Token Kontext in Web/App-Interaktionen macht DeepSeek zu einem der wenigen Modelle, die ein ganzheitliches Verständnis langer Transkripte ohne Fragmentierung sowie von Codebasen, juristischen Dokumenten oder ganzen Büchern in einer Sitzung ermöglichen. Dies hat enorme Auswirkungen auf reale Anwendungen — von Forschung und Schreiben bis hin zur Analyse von Unternehmensdokumenten.

2. Änderungen im Interaktionsstil

Der jüngste Rollout hat den Konversationston von DeepSeek merklich verändert. Viele Nutzer haben bemerkt, dass die aktualisierte Modellinteraktion neutraler oder „schlichter“ wirkt — etwa durch die Verwendung generischer Bezeichnungen wie „User“ statt personalisierter Spitznamen und durch knappere Antworten in Deep-Reasoning-Modi. Diese stilistischen Verschiebungen sorgen in sozialen Netzwerken für Gesprächsstoff; manche Nutzer äußern Unbehagen oder Überraschung.

3. Wissensstichtag und aktualisierter Kontext

Die Wissensbasis hinter der App wurde auf den Stand Mai 2025 aktualisiert, während der API-Dienst weiterhin auf V3.2 mit seinem früheren Wissensstichtag basiert. Diese Aufspaltung deutet darauf hin, dass DeepSeek mit inkrementellen Verbesserungen experimentiert, bevor ein vollständiges V4-Plattform-Upgrade erfolgt.

4. Vorbereitungen für die V4-Integration

Ein klarer strategischer Zweck des Updates besteht darin, Infrastruktur und Nutzererlebnis im Vorfeld des kommenden DeepSeek V4 zu testen. Die Unterstützung großer Kontexte und Änderungen am Speicher dienen wahrscheinlich als realer Stresstest für die derzeit in Entwicklung befindlichen Architekturen — um Leistung, Zuverlässigkeit und Feedback vor der vollständigen Bereitstellung zu evaluieren.

Welche neuen technischen Funktionen sind im Update enthalten und wie funktionieren sie?

Reaktionen der Nutzer

Der Rollout hat eine breite Palette an Reaktionen ausgelöst:

Einerseits sind viele Nutzer begeistert von der Kontexterweiterung und ihrem Potenzial für tiefere Interaktionen und komplexere Problemlösungen.
Andererseits haben zahlreiche Nutzer öffentlich Kommentare zu Änderungen im Ton und im Konversationsstil abgegeben und die Antworten als weniger ansprechend, weniger empathisch oder schlicht „kühler“ beschrieben — was zu viralen Diskussionen in sozialen Medien führte.

Engram: bedingter Speicher für selektives Abrufen

Engram ist die zentrale Idee des Updates. Konzeptionell ist es ein bedingter Abrufmechanismus, der in die Modellarchitektur eingebettet ist: Wenn die Eingabe Hinweise enthält, die mit gespeicherten Engrammen verknüpft sind, ruft das Netzwerk vorcomputierte Vektorrepräsentationen ab, um teure Inferenzschichten zu ergänzen (oder teilweise zu ersetzen). Der behauptete Nutzen ist zweifach: wiederholte Berechnungen zu statischem Wissen reduzieren und einen robusten Mechanismus bereitstellen, um faktisches Gedächtnis zu aktualisieren oder zu patchen, ohne das gesamte Modell neu zu trainieren. Technische Zusammenfassungen und Entwickler-Vorschauen zeigen, dass Engram sowohl für Codewissen (Bibliotheken, Funktionssignaturen) als auch für faktisches Erinnern über Dokumente hinweg vorgesehen ist.

mHC (mannigfaltigkeitsbeschränkte Hyperverbindungen)

mHC, wie in der Vorschau und unterstützenden technischen Notizen präsentiert, ist eine Architektursstrategie, die darauf abzielt, Parameterinteraktionen auf sinnvolle Untermannigfaltigkeiten zu beschränken. Diese Beschränkung reduziert die Anzahl paarweiser Aktivierungen, die berechnet werden müssen, und verbessert so die Recheneffizienz sowohl beim Training als auch bei der Inferenz. Die Theorie besagt, dass die Ausdrucksstärke dort erhalten bleibt, wo sie zählt (auf aufgabenrelevanten Mannigfaltigkeiten), während unnötige Berechnungen andernorts eingespart werden — wodurch effektiv mehr Nutzen aus derselben Hardware gezogen wird. Frühe Beschreibungen sind technisch und vielversprechend, werfen jedoch auch Fragen zur Implementierung und Verifikation auf (siehe unten).

DeepSeek Sparse Attention (DSA) und Millionen-Token-Kontexte

Eine der greifbarsten Behauptungen ist die Unterstützung von 1M+ Token-Kontexten durch einen Mix aus Sparse-Attention-Techniken und dynamischer Trigger-Logik. Wenn dies in der Produktion realisiert wird, kann ein einzelner Inferenzdurchlauf ganze Repositories, lange Transkripte oder mehrere Dateien umfassende Patches berücksichtigen — ein Plus für Aufgaben wie Codebase-Zusammenfassungen, Multi-File-Refactorings und langlaufende Konversationsagenten. Vorschau-Materialien und Anbieter-Benchmarks berichten von Durchsatz in großen Kontexten und deuten auf erhebliche Effizienzgewinne im Vergleich zu einigen Wettbewerbern hin. Eine unabhängige Verifikation ist in diesem Stadium noch begrenzt.

Was ist als Nächstes zu erwarten — und was sagt uns dieses Update über DeepSeek v4?

Kurz gesagt: Das öffentliche Update ist sowohl eine funktionale Erweiterung als auch ein Startbrett für einen größeren Launch. Branchenberichte und DeepSeeks eigener Zeitplan deuten auf einen bevorstehenden v4-Launch hin (angepeilt zum Zeitfenster rund um das chinesische Neujahr), der wahrscheinlich Langkontext-Speicher, eine spezialisierte Engram-ähnliche Speicherarchitektur sowie verbesserte Coding- und Agentenfähigkeiten bündelt.

Im Folgenden eine sorgfältige, evidenzbasierte Spekulation darüber, was DeepSeek v4 voraussichtlich enthalten wird — gestützt auf aktuelle Veränderungssignale und Branchenerwartungen.

Erwartung 1 — Nativer langlebiger Speicher und indiziertes Retrieval

Angesichts der Million-Token-Experimente der App und des expliziten Fokus auf Agenten in V3.2 wird v4 wahrscheinlich ein Speichersubsystem formalisieren, das indiziertes Wissen über Sitzungen hinweg persistiert (nicht nur ein größeres flüchtiges Kontextfenster). Dieses Subsystem würde kombinieren:

Dichtes Retrieval über gespeicherte Embeddings.
Effizientes Chunking zur Balance von Latenz und Token-Kosten.
Eine Kohärenzschicht, die abgerufene Fragmente in das interne Kontextfenster des Modells einfügt.

Wenn implementiert, könnten Agenten damit persistente Persönlichkeiten, Nutzerpräferenzen und eine reichhaltige Projekthistorie beibehalten, ohne die Daten in jeder Sitzung erneut einzuspeisen.

Erwartung 2 — Spezialisierte Code-Generierung und Multi-File-Reasoning

Programmierfähigkeiten sind eine Priorität für v4, was auf Modelloptimierungen und Benchmark-Verbesserungen für Entwickler-Workflows hindeutet. Zu erwarten sind native Multi-File-Refactor-Fähigkeiten, verbesserte Unit-Test-Synthese und werkzeugbewusste Code-Generierung, die Code über abgekapselte Sandbox-Toolchains ausführen, evaluieren und iterativ verbessern kann. Genau solche Aufgaben werden durch Langkontext-Modelle ermöglicht.

Erwartung 3 — Stärkerer Fokus auf Agentensicherheit und Verifikation

Angesichts der öffentlichen Prüfung von Trainingspraktiken wird DeepSeek wahrscheinlich Prüfbarkeit priorisieren: reproduzierbare Trainingsprotokolle, klarere Provenienzerklärungen und gehärtete Sicherheitsmaßnahmen, die während mehrstufiger Tool-Interaktionen Halluzinationen oder Provenienzlücken kennzeichnen. Es sind Produktfunktionen zu erwarten, die die Provenienz für Unternehmenskunden und Forschende sichtbar machen.

Erwartung 4 — Wettbewerbsfähige Roadmap und Partner-Ökosystem

Die v4-Roadmap wird von inländischen und globalen Akteuren als Marktsignal gelesen werden. Da Rivalen aggressive Updates ausliefern (von großen Anbietern mit Fokus auf Effizienz und Mobile-Deployment bis zu Nischenakteuren, die auf Open-Source-Modelle setzen), muss DeepSeek Offenheit und Verteidigungsfähigkeit austarieren. Liefert v4 signifikante Zugewinne zu niedrigeren Kosten, wird dies den Trend zu erschwinglichen, leistungsfähigen Modellen in China und darüber hinaus beschleunigen — und voraussichtlich die grenzüberschreitende regulatorische Prüfung intensivieren.

Fazit: Eine wachsende KI-Kraft

Das jüngste DeepSeek-Update markiert einen bedeutsamen Schritt hin zu einer breiteren Transformation der KI-Fähigkeiten. Auch wenn das Unternehmen V4 noch nicht vollständig veröffentlicht hat, zeigen die Vorschauverbesserungen — insbesondere bei der Kontextlänge und der Umgestaltung der Interaktion — das klare Bekenntnis, die Fähigkeiten großer Sprachmodelle voranzutreiben. Mit V4 am Horizont ist DeepSeek in einer guten Position, die nächste Ära großskaliger, kosteneffizienter, hochperformanter KI mitzuprägen.

Entwickler können jetzt über Deepseek API auf CometAPI zugreifen. Um loszulegen, erkunde die Fähigkeiten des Modells im Playground und konsultiere den API guide für detaillierte Anleitungen. Bevor du zugreifst, stelle bitte sicher, dass du dich bei CometAPI angemeldet und den API-Schlüssel erhalten hast. CometAPI bietet einen Preis, der deutlich unter dem offiziellen Preis liegt, um dir die Integration zu erleichtern.

Bereit, loszulegen?→ Melde dich noch heute bei Deepseek an!

Wenn du mehr Tipps, Anleitungen und Neuigkeiten zu KI erfahren möchtest, folge uns auf VK, X und Discord!

Was genau hat sich im jüngsten DeepSeek-Update geändert?

Welche Version ist das und was hat sich geändert?

Unter der Haube: Was treibt die Veränderung an?

Reaktionen der Nutzer

Was sind die wichtigsten Merkmale dieses Updates?

1. Massive Kontext-Erweiterung

2. Änderungen im Interaktionsstil

3. Wissensstichtag und aktualisierter Kontext

4. Vorbereitungen für die V4-Integration

Welche neuen technischen Funktionen sind im Update enthalten und wie funktionieren sie?

Reaktionen der Nutzer

Engram: bedingter Speicher für selektives Abrufen

mHC (mannigfaltigkeitsbeschränkte Hyperverbindungen)

DeepSeek Sparse Attention (DSA) und Millionen-Token-Kontexte

Was ist als Nächstes zu erwarten — und was sagt uns dieses Update über DeepSeek v4?

Erwartung 1 — Nativer langlebiger Speicher und indiziertes Retrieval

Erwartung 2 — Spezialisierte Code-Generierung und Multi-File-Reasoning

Erwartung 3 — Stärkerer Fokus auf Agentensicherheit und Verifikation

Erwartung 4 — Wettbewerbsfähige Roadmap und Partner-Ökosystem

Fazit: Eine wachsende KI-Kraft

Mehr lesen

500+ Modelle in einer API