模型支持企业博客
500+ AI 模型 API,一次搞定,就在 CometAPI
模型 API
开发者
快速入门文档API 仪表板
资源
AI 模型博客企业更新日志关于
2025 CometAPI。保留所有权利。隐私政策服务条款
Home/Models/Google/Gemini 2.5 Flash Lite
G

Gemini 2.5 Flash Lite

输入:$0.08/M
输出:$0.32/M
上下文:1M
最大输出:65K
一款为高性价比与高吞吐量优化的 Gemini 2.5 Flash 模型。最小、最具性价比的模型,专为大规模使用而构建。
新
商用
Playground
概览
功能亮点
定价
API
版本

Tekniske detaljer

  • Adaptiv resonnering: Gemini 2.5 Flash-Lite støtter tenkning ved behov, slik at utviklere kan tildele datakraft bare når dypere resonnering er nødvendig.
  • Verktøyintegrasjoner: Full kompatibilitet med Gemini 2.5s innebygde verktøy, inkludert Grounding with Google Search, Code Execution, URL Context og Function Calling for sømløse multimodale arbeidsflyter.
  • Model Context Protocol (MCP): Utnytter Googles MCP for å hente sanntidsdata fra nettet, og sikrer at svarene er oppdaterte og kontekstuelt relevante.
  • Distribusjonsalternativer: Tilgjengelig gjennom CometAPI, Gemini API, Vertex AI og Google AI Studio, med et forhåndsvisningsspor for tidlige brukere som vil eksperimentere og gi tilbakemeldinger.

Referanseytelse for Gemini 2.5 Flash-Lite

  • Forsinkelse (latency): Oppnår opptil 50% lavere median svartider sammenlignet med Gemini 2.5 Flash, med typisk under 100 ms latens på standard klassifiserings- og oppsummeringsbenchmarker.
  • Gjennomstrømning: Optimalisert for høyvolums arbeidsbelastninger, opprettholder titusenvis av forespørsler per minutt uten ytelsesforringelse.
  • Pris-ytelse: Viser 25% reduksjon i kostnad per 1,000 tokens sammenlignet med Flash-motstykket, og er dermed det Pareto-optimale valget for kostnadssensitive utrullinger.
  • Bransjeadopsjon: Tidlige brukere rapporterer sømløs integrasjon i produksjonspipelines, med ytelsesmetricer som samsvarer med eller overgår de første prognosene.

Gemini 2.5 Flash Lite


Ideelle bruksområder

  • Høyfrekvente, lavkompleksitetsoppgaver: Automatisk merking, sentimentanalyse og masseoversettelse
  • Kostnadssensitive pipeliner: Datauttrekk fra store dokumentkorpora, periodisk batch-oppsummering
  • Edge- og mobilsituasjoner: Når latens er kritisk, men ressursbudsjettene er begrenset

Begrensninger ved Gemini 2.5 Flash-Lite

  • Forhåndsvisningsstatus: Kan gjennomgå API-endringer før GA; integrasjoner bør ta høyde for mulige versjonsøkninger.
  • Ingen finjustering underveis: Kan ikke laste opp egendefinerte vekter; stol på prompt engineering og systemmeldinger.
  • Redusert kreativitet: Tunet for deterministiske oppgaver med høy gjennomstrømning; mindre egnet for åpen generering eller «kreativ» skriving.
  • Ressurstak: Skalerer lineært bare opp til ~16 vCPUs; utover dette avtar gjennomstrømningsgevinstene.
  • Multimodale begrensninger: Støtter bilde-/lydinndata, men med begrenset kvalitet; ikke ideelt for tunge visjons- eller lydtranskripsjonsoppgaver.
  • Avveiing for kontekstvindu: Selv om det aksepterer opptil 1 M tokens, kan praktisk inferens i den skalaen gi redusert gjennomstrømning.

Gemini 2.5 Flash Lite 的功能

了解 Gemini 2.5 Flash Lite 的核心能力,帮助提升性能与可用性,并改善整体体验。

Gemini 2.5 Flash Lite 的定价

查看 Gemini 2.5 Flash Lite 的竞争性定价,满足不同预算与使用需求,灵活方案确保随需求扩展。
model nameInput ($/1M)Output ($/1M)
gemini-2.5-flash-lite0.080.32
gemini-2.5-flash-lite-preview-06-170.080.32
gemini-2.5-flash-lite-thinking0.080.32
gemini-2.5-flash-lite-preview-06-17-thinking0.080.32
gemini-2.5-flash-lite-preview-09-20250.080.32

Gemini 2.5 Flash Lite 的示例代码与 API

获取完整示例代码与 API 资源,简化 Gemini 2.5 Flash Lite 的集成流程,我们提供逐步指导,助你发挥模型潜能。
POST
/v1beta/models/{model}:{operator}
POST
/v1/chat/completions

Gemini 2.5 Flash Lite 的版本

Gemini 2.5 Flash Lite 可能存在多个快照,原因包括:更新后保持一致性需要保留旧版、给开发者留出迁移窗口,以及全球/区域端点提供的优化差异。具体差异请参考官方文档。
version
gemini-2.5-flash-lite
gemini-2.5-flash-lite-preview-09-2025
gemini-2.5-flash-lite-preview-06-17
gemini-2.5-flash-lite-preview-06-17-thinking
gemini-2.5-flash-lite-thinking

更多模型

A

Claude Opus 4.6

输入:$4/M
输出:$20/M
Claude Opus 4.6 是 Anthropic 的“Opus”级大型语言模型,于 2026 年 2 月发布。其定位为知识工作与研究工作流的主力模型——提升长上下文推理、多步骤规划、工具使用(包括代理型软件工作流),以及计算机使用类任务,如自动生成幻灯片和电子表格。
A

Claude Sonnet 4.6

输入:$2.4/M
输出:$12/M
Claude Sonnet 4.6 是迄今为止我们最强大的 Sonnet 模型。它对模型在编码、计算机使用、长上下文推理、智能体规划、知识工作和设计等方面的能力进行了全面升级。Sonnet 4.6 还在 beta 阶段提供 1M token 上下文窗口。
O

GPT-5.4 nano

输入:$0.16/M
输出:$1/M
GPT-5.4 nano 专为速度和成本最为关键的任务而设计,例如分类、数据提取、排序以及子智能体。
O

GPT-5.4 mini

输入:$0.6/M
输出:$3.6/M
GPT-5.4 mini 将 GPT-5.4 的优势融入到一款更快速、更高效、专为大规模工作负载设计的模型中。
A

Claude Mythos Preview

A

Claude Mythos Preview

即将推出
输入:$60/M
输出:$240/M
Claude Mythos Preview 是我们迄今为止最强大的前沿模型,并显示出 在许多评测基准上的得分相较于我们此前的前沿模型 Claude Opus 4.6 有显著跃升。
X

mimo-v2-pro

输入:$0.8/M
输出:$2.4/M
MiMo-V2-Pro 是 Xiaomi 的旗舰基础模型,拥有超过 1T 的总参数量和 1M 的上下文长度,并针对智能体场景进行了深度优化。它对 OpenClaw 等通用智能体框架具有很强的适配性。在标准 PinchBench 和 ClawBench 基准测试中,它跻身全球第一梯队,感知性能接近 Opus 4.6。MiMo-V2-Pro 旨在作为智能体系统的大脑,协调复杂工作流,推动生产工程任务,并可靠地交付结果。

相关博客

免费版 Gemini 2.5 Pro API 是否出现故障?2025 年免费配额的变更
Dec 11, 2025
gemini-2-5-pro
gemini-2-5-flash

免费版 Gemini 2.5 Pro API 是否出现故障?2025 年免费配额的变更

Google 已大幅收紧 Gemini API 的免费层:Gemini 2.5 Pro 已从免费层移除,Gemini 2.5 Flash 的每日免费请求被大幅削减(据报道:~250 → ~20/天)。这并不意味着该模型在实验用途上已永久“死掉”,但这确实意味着对于许多现实世界的用例,免费访问实际上已被大幅削弱。