Tekniske spesifikasjoner for DeepSeek-V4-Flash
| Element | Detaljer |
|---|---|
| Modell | DeepSeek-V4-Flash |
| Leverandør | DeepSeek |
| Familie | DeepSeek-V4 forhåndsvisningsserie |
| Arkitektur | Mixture-of-Experts (MoE) |
| Totalt antall parametere | 284B |
| Aktiverte parametere | 13B |
| Kontekstlengde | 1,000,000 tokens |
| Presisjon | FP4 + FP8 blandet |
| Resonneringsmoduser | Non-think, Think, Think Max |
| Utgivelsesstatus | Forhåndsvisningsmodell |
| Lisens | MIT-lisens |
Hva er DeepSeek-V4-Flash?
DeepSeek-V4-Flash er DeepSeeks effektivitetsfokuserte forhåndsvisningsmodell i V4-serien. Den er bygget som en Mixture-of-Experts-språkmodell med et relativt lite aktivt fotavtrykk til størrelsen, noe som hjelper den å være responsiv samtidig som den støtter et svært stort 1M-token kontekstvindu.
Hovedfunksjoner i DeepSeek-V4-Flash
- Kontekst på én million token: Modellen støtter et 1,000,000-token kontekstvindu, noe som gjør den egnet for svært lange dokumenter, store kodebaser og flerstegs agentsesjoner.
- Effektivitetsfokusert MoE-design: Den bruker 284B totale parametere, men bare 13B aktiverte parametere per forespørsel, en oppsett som er rettet mot raskere og mer effektiv inferens.
- Tre resonneringsmoduser: Non-think, Think og Think Max lar deg bytte hastighet mot dypere resonnering når oppgaven blir vanskeligere.
- Sterk langkontekst-arkitektur: DeepSeek sier at V4-serien kombinerer Compressed Sparse Attention og Heavily Compressed Attention for å forbedre langkontekst-effektiviteten.
- Konkurransedyktig koding og agentatferd: Modellen rapporterer sterke resultater på kode- og agent-benchmarker, inkludert HumanEval, SWE Verified, Terminal Bench 2.0 og BrowseComp.
- Åpne vekter og lokal utrulling: Utgivelsen inkluderer modellvekter, veiledning for lokal inferens og en MIT-lisens, noe som gjør selvhosting og eksperimentering praktisk.
Ytelse på benchmarker for DeepSeek-V4-Flash
Utvalgte resultater fra den offisielle modellkortet viser at DeepSeek-V4-Flash forbedrer seg over DeepSeek-V3.2-Base på flere kjernebenchmarker:
| Benchmark | DeepSeek-V3.2-Base | DeepSeek-V4-Flash-Base | DeepSeek-V4-Pro-Base |
|---|---|---|---|
| AGIEval (EM) | 80.1 | 82.6 | 83.1 |
| MMLU (EM) | 87.8 | 88.7 | 90.1 |
| MMLU-Pro (EM) | 65.5 | 68.3 | 73.5 |
| HumanEval (Pass@1) | 62.8 | 69.5 | 76.8 |
| LongBench-V2 (EM) | 40.2 | 44.7 | 51.5 |
I tabellen for resonnering og agenter leverer Flash-varianten også solide resultater på terminal- og programvareoppgaver, der Flash Max når 56.9 på Terminal Bench 2.0 og 79.0 på SWE Verified, samtidig som den fortsatt ligger bak den større Pro-modellen på de mest kunnskapstunge og komplekse agentoppgavene.
DeepSeek-V4-Flash vs DeepSeek-V4-Pro vs DeepSeek-V3.2
| Modell | Best egnet | Avveiing |
|---|---|---|
| DeepSeek-V4-Flash | Raskt arbeid med lang kontekst, kodeassistenter og agentflyter med høy gjennomstrømning | Litt bak Pro på ren kunnskap og de mest komplekse agentoppgavene |
| DeepSeek-V4-Pro | Oppgaver som krever høyest kapasitet, dypere resonnering og vanskeligere agentarbeidsflyter | Tyngre og mindre effektivitetsorientert enn Flash |
| DeepSeek-V3.2 | Eldre basis for sammenligning og migreringsplanlegging | Lavere benchmark-ytelse enn V4-Flash i de offisielle tabellene |
Typiske brukstilfeller for DeepSeek-V4-Flash
- Analyse av lange dokumenter for kontrakter, forskningspakker, support-kunnskapsbaser og interne wikier.
- Kodeassistenter som må inspisere store repoer, følge instruksjoner på tvers av mange filer og holde konteksten levende.
- Agentarbeidsflyter der modellen må resonere, kalle verktøy og iterere uten å miste tråden.
- Bedriftschat-systemer som drar nytte av et svært stort kontekstvindu og utrulling med lav friksjon.
- Prototypiske lokale utrullinger for team som vil evaluere DeepSeek-V4-oppførsel før produksjonsherding.
Slik får du tilgang til og bruker Deepseek v4 Flash API
Trinn 1: Registrer deg for API-nøkkel
Logg inn på cometapi.com. Hvis du ikke er bruker ennå, registrer deg først. Logg inn på din CometAPI console. Hent API-nøkkelen (tilgangslegitimasjonen) for grensesnittet. Klikk “Add Token” ved API token i personal center, hent token-nøkkelen: sk-xxxxx og send inn.
Trinn 2: Send forespørsler til deepseek v4 flash API
Velg endepunktet “deepseek-v4-flash” for å sende API-forespørselen og angi forespørselsobjektet. Forespørselsmetode og -innhold hentes fra API-dokumentasjonen på nettstedet vårt. Nettstedet vårt tilbyr også Apifox-test for din bekvemmelighet. Erstatt <YOUR_API_KEY> med din faktiske CometAPI-nøkkel fra kontoen din. Where to call it: Anthropic Messages format og Chat format.
Sett inn spørsmålet eller forespørselen din i content-feltet—det er dette modellen svarer på. Behandle API-responsen for å hente det genererte svaret.
Trinn 3: Hent og verifiser resultater
Behandle API-responsen for å hente det genererte svaret. Etter behandling svarer API-et med oppgavestatus og utdata. Aktiver funksjoner som streaming, prompt-caching eller håndtering av lang kontekst via standardparametere.