Aggiornamento DeepSeek: cosa è cambiato, cosa c'è di nuovo e perché è importante

Nel febbraio 2026, la startup cinese di IA DeepSeek ha rilasciato un aggiornamento significativo alla sua applicazione online e all’interfaccia web, segnalando slancio verso il rilascio del modello di nuova generazione, DeepSeek V4. Sebbene l’aggiornamento arrivi prima del modello V4 completo, ha già acceso la discussione tra utenti e osservatori del settore per i cambiamenti nel comportamento d’interazione, le capacità di lungo contesto e i test preparatori per il potenziale futuro.

DeepSeek è balzata sulla scena globale con le sue varianti precedenti—soprattutto DeepSeek V3.2 e DeepSeek–R1—che hanno combinato elevate prestazioni di task con scalabilità conveniente. Il rilascio di R1, in particolare, ha catturato l’attenzione internazionale all’inizio del 2025 per aver scosso i mercati globali e fatto scendere le performance azionarie dei concorrenti, illustrando il potenziale dirompente di DeepSeek.

Cosa è cambiato esattamente nel recente aggiornamento di DeepSeek?

Quale versione è questa e cosa è cambiato?

Il recente aggiornamento riguarda l’applicazione online e l’interfaccia web di DeepSeek, ma, cosa cruciale, non ancora il modello API. Secondo diverse fonti:

L’aggiornamento dell’applicazione è meglio descritto come un test della struttura di lungo contesto — consentendo agli utenti web e app di accedere a un supporto di contesto fino a 1 milione di token. Si tratta di un salto significativo rispetto alla finestra di contesto di ~128 K nell’offerta API di DeepSeek V3.2.
L’upgrade aumenta la memoria effettiva per una singola conversazione o attività, consentendo al modello di ricordare ed elaborare molte più informazioni. Le segnalazioni indicano che si tratta di 10× la capacità di memoria precedente — una svolta per il ragionamento multi‑fase e di lunga durata.
In termini di naming della versione, la maggior parte dei segnali pubblici suggerisce che questo aggiornamento sia una spinta tecnica pre‑V4 — non ancora il rilascio formale di DeepSeek V4, ma fortemente preparatorio.

Sotto il cofano: cosa guida il cambiamento?

Dietro le quinte, il repository GitHub di DeepSeek mostra aggiunte etichettate con un identificatore interno (“MODEL1”), suggerendo una nuova architettura di modello distinta da V3.2. La struttura del codice indica tecniche di ottimizzazione della memoria, miglioramenti al supporto FP8 e compatibilità con le più recenti architetture GPU di Nvidia — tutti componenti chiave attesi in DeepSeek V4.

Inoltre, DeepSeek ha pubblicato ricerche su “Engram”, un modulo di lookup di memoria che ripensa il modo in cui i modelli linguistici di grandi dimensioni gestiscono lunghi contesti e fatti critici. Engram sembra posizionato come una tecnologia fondativa per la prossima generazione — potenzialmente alla base delle capacità di memoria estesa di DeepSeek V4.

Reazioni degli utenti

Il rollout ha provocato un’ampia gamma di reazioni:

Da un lato, molti utenti sono entusiasti dell’espansione del contesto e del suo potenziale per interazioni più profonde e problem solving più complesso.
Dall’altro, una parte significativa degli utenti ha commentato pubblicamente i cambiamenti nel tono e nello stile conversazionale, descrivendo le risposte come meno coinvolgenti, meno empatiche o semplicemente “più fredde” rispetto a prima — generando discussioni virali sui social.

Questa divergenza evidenzia una realtà importante del deployment dell’IA: gli upgrade delle capacità tecniche possono rimodellare l’esperienza utente in modi inattesi, richiedendo un affinamento iterativo prima del rilascio finale.

Quali sono le caratteristiche chiave di questo aggiornamento?

1. Espansione massiva del contesto

Supportare fino a 1 milione di token di contesto nell’interazione web/app rende DeepSeek uno dei pochi modelli in grado di una comprensione globale, senza interruzioni, di lunghi trascritti, codebase, documenti legali o interi libri in una singola sessione. Questo ha enormi implicazioni per l’uso nel mondo reale, dalla ricerca e scrittura all’analisi documentale aziendale.

2. Cambiamenti nello stile di interazione

Il rollout recente ha cambiato sensibilmente il tono conversazionale di DeepSeek. Molti utenti hanno notato che l’interazione del modello aggiornato appare più neutra o “semplice” — usando identificatori generici come “User” invece di soprannomi personalizzati e offrendo risposte più concise nelle modalità di ragionamento profondo. Questi cambiamenti stilistici hanno generato buzz sulle piattaforme social, con alcuni utenti che esprimono disagio o sorpresa.

3. Knowledge cutoff e contesto aggiornato

La base di conoscenza dietro l’app è stata aggiornata per riflettere informazioni fino a maggio 2025, sebbene il servizio API rimanga su V3.2 con il precedente knowledge cutoff. Questa divisione suggerisce che DeepSeek stia sperimentando miglioramenti incrementali in vista di un upgrade completo della piattaforma V4.

4. Preparativi per l’integrazione di V4

Un obiettivo strategico chiaro dell’aggiornamento è testare infrastruttura ed esperienza utente in anticipo rispetto al prossimo DeepSeek V4. Il supporto per grandi contesti e i cambiamenti alla memoria probabilmente servono da stress test nel mondo reale per le architetture in fase di sviluppo — aiutando gli sviluppatori a valutare prestazioni, affidabilità e feedback prima del deployment completo.

Quali nuove funzionalità tecniche sono incluse nell’aggiornamento e come funzionano?

Reazioni degli utenti

Il rollout ha provocato un’ampia gamma di reazioni:

Da un lato, molti utenti sono entusiasti dell’espansione del contesto e del suo potenziale per interazioni più profonde e problem solving più complesso.
Dall’altro, una parte significativa degli utenti ha commentato pubblicamente i cambiamenti nel tono e nello stile conversazionale, descrivendo le risposte come meno coinvolgenti, meno empatiche o semplicemente “più fredde” rispetto a prima — generando discussioni virali sui social.

Engram: memoria condizionale per il richiamo selettivo

Engram è l’idea di punta dell’aggiornamento. Concettualmente è un meccanismo di retrieval condizionale incorporato nell’architettura del modello: quando l’input contiene segnali legati agli engram memorizzati, la rete recupera rappresentazioni vettoriali precompute per integrare (o talvolta sostituire) livelli costosi di inferenza. Il beneficio dichiarato è duplice: ridurre la computazione ripetuta su conoscenza statica e fornire un meccanismo robusto per aggiornare o correggere la memoria fattuale senza riaddestrare l’intero modello. Sintesi tecniche e anteprime per sviluppatori mostrano Engram destinato sia alla conoscenza del codice (librerie, firme di funzioni) sia al richiamo fattuale su documenti.

mHC (iperconnessioni vincolate al manifold)

mHC, come presentato nell’anteprima e nelle note tecniche di supporto, è una strategia architetturale volta a vincolare le interazioni tra parametri a sotto‑manifold significativi. Tale vincolo riduce il numero di attivazioni a coppie che devono essere calcolate, migliorando l’efficienza computazionale sia in training sia in inferenza. La teoria è che si preservi la potenza espressiva dove serve (manifold rilevanti per il task) riducendo la computazione inutile altrove — spremendo di fatto più utilità dallo stesso hardware. Le prime descrizioni sono tecniche e promettenti, ma sollevano anche questioni di implementazione e verifica (vedi sotto).

DeepSeek Sparse Attention (DSA) e contesti da un milione di token

Una delle affermazioni più tangibili è il supporto a contesti da 1M+ token tramite un mix di tecniche di attenzione sparsa e logica di attivazione dinamica. Se realizzato in produzione, questo permette a un singolo passaggio di inferenza di considerare interi repository, lunghi trascritti o patch multi‑file — un vantaggio per attività come la sintesi di codebase, i refactor multi‑file e agenti conversazionali di lunga durata. Materiali in anteprima e benchmark del fornitore riportano throughput su lunghi contesti e suggeriscono guadagni di efficienza significativi rispetto ad alcuni concorrenti. La verifica indipendente è ancora limitata in questa fase.

Cosa possiamo aspettarci dopo — e cosa ci dice questo aggiornamento su DeepSeek v4?

Risposta breve: l’aggiornamento pubblico è sia un miglioramento funzionale sia un terreno di staging per un lancio più ampio. Le notizie di settore e la timeline di DeepSeek indicano un lancio imminente della v4 (previsto per la finestra del Capodanno Lunare) che probabilmente includerà memoria a lungo termine, un’architettura di memoria tipo Engram specializzata e capacità migliorate per coding e agenti.

Di seguito una speculazione attenta e basata su evidenze su ciò che probabilmente includerà DeepSeek v4 — fondata sui segnali di cambiamento attuali e sulle aspettative del settore.

Aspettativa 1 — Memoria nativa di lunga durata e retrieval indicizzato

Dato gli esperimenti dell’app con il milione di token e il focus esplicito sugli agenti in V3.2, la v4 probabilmente formalizzerà un sottosistema di memoria che persiste conoscenza indicizzata tra le sessioni (non soltanto un contesto effimero più ampio). Tale sottosistema combinerebbe:

Retrieval denso su embedding memorizzati.
Chunking efficiente per bilanciare latenza e costo in token.
Uno strato di coerenza per cucire i frammenti recuperati nella finestra di contesto interna del modello.

Se implementato, ciò consentirebbe agli agenti di mantenere personalità persistenti, preferenze utente e una ricca cronologia di progetto senza re‑ingestire i dati a ogni sessione.

Aspettativa 2 — Generazione di codice specializzata e ragionamento multi‑file

La capacità di coding come priorità per la v4, con ottimizzazioni del modello e miglioramenti ai benchmark mirati ai workflow degli sviluppatori. Aspettatevi capacità native di refactor multi‑file, migliore sintesi di test unitari e generazione di codice “tool‑aware” che possa eseguire, valutare e iterare sul codice tramite toolchain sandboxed. Sono esattamente i tipi di task sbloccati dai modelli a lungo contesto.

Aspettativa 3 — Maggiore enfasi su sicurezza degli agenti e verifica

Data l’attenzione pubblica sulle pratiche di training, DeepSeek probabilmente darà priorità alla verificabilità: log di training riproducibili, dichiarazioni di provenienza più chiare e mitigazioni di sicurezza rafforzate che segnalino allucinazioni o lacune di provenienza durante interazioni multi‑step con strumenti. Aspettatevi funzionalità di prodotto che rendano la provenienza visibile ai clienti enterprise e ai ricercatori.

Aspettativa 4 — Roadmap competitiva ed ecosistema di partner

La roadmap della v4 sarà letta come un segnale di mercato da attori nazionali e globali. Con i rivali che rilasciano aggiornamenti aggressivi (dai player principali che puntano su efficienza e deployment mobile a quelli di nicchia che raddoppiano sui modelli open‑source), DeepSeek deve bilanciare apertura e difendibilità. Se la v4 offrirà guadagni significativi a costi inferiori, accelererà la tendenza verso modelli convenienti ad alte capacità in Cina e oltre — e probabilmente intensificherà lo scrutinio normativo transfrontaliero.

In conclusione: una forza dell’IA in crescita

Il recente aggiornamento di DeepSeek segna un passo significativo verso una trasformazione più ampia dell’intelligenza dell’IA. Sebbene l’azienda non abbia ancora lanciato completamente la V4, le anteprime — soprattutto in termini di lunghezza del contesto e ristrutturazione interattiva — rivelano l’impegno a spingere in avanti le capacità dei LLM. Con la V4 all’orizzonte, DeepSeek è pronta a essere una figura centrale nel plasmare la prossima era dell’IA su larga scala, conveniente e ad alte prestazioni.

Gli sviluppatori possono accedere alla Deepseek API tramite CometAPI già da ora. Per iniziare, esplora le capacità del modello nel Playground e consulta la guida API per istruzioni dettagliate. Prima di accedere, assicurati di aver effettuato l’accesso a CometAPI e di aver ottenuto la chiave API. CometAPI offre un prezzo molto più basso rispetto a quello ufficiale per aiutarti a integrare.

Pronto per iniziare?→ Registrati a DeepSeek oggi !

Se vuoi conoscere altri suggerimenti, guide e novità sull’IA seguici su VK, X e Discord!

Cosa è cambiato esattamente nel recente aggiornamento di DeepSeek?

Quale versione è questa e cosa è cambiato?

Sotto il cofano: cosa guida il cambiamento?

Reazioni degli utenti

Quali sono le caratteristiche chiave di questo aggiornamento?

1. Espansione massiva del contesto

2. Cambiamenti nello stile di interazione

3. Knowledge cutoff e contesto aggiornato

4. Preparativi per l’integrazione di V4

Quali nuove funzionalità tecniche sono incluse nell’aggiornamento e come funzionano?

Reazioni degli utenti

Engram: memoria condizionale per il richiamo selettivo

mHC (iperconnessioni vincolate al manifold)

DeepSeek Sparse Attention (DSA) e contesti da un milione di token

Cosa possiamo aspettarci dopo — e cosa ci dice questo aggiornamento su DeepSeek v4?

Aspettativa 1 — Memoria nativa di lunga durata e retrieval indicizzato

Aspettativa 2 — Generazione di codice specializzata e ragionamento multi‑file

Aspettativa 3 — Maggiore enfasi su sicurezza degli agenti e verifica

Aspettativa 4 — Roadmap competitiva ed ecosistema di partner

In conclusione: una forza dell’IA in crescita

Leggi di più

500+ Modelli in Una API