구글, 새로운 제미니 2.5 플래시라이트 모델 출시

CometAPI
AnnaJun 17, 2025
구글, 새로운 제미니 2.5 플래시라이트 모델 출시

Google DeepMind는 오늘 Gemini 2.5 제품군의 대대적인 확장을 발표했습니다. Gemini 2.5 Pro와 Gemini 2.5 Flash의 안정적인 릴리스와 함께 완전히 새로워진 Gemini 2.5 Flash‑Lite 모델의 미리보기가 공개되었습니다. 이번 업데이트는 다양한 워크로드에 맞춰 비용, 속도, 성능의 균형을 맞춘 다양한 AI 모델을 제공하려는 Google의 지속적인 노력을 보여줍니다.

안정적인 릴리스: Gemini 2.5 Pro 및 Flash

17년 2025월 2.5일, Google은 Gemini 2.5 Pro와 Gemini 2.5 Flash의 정식 출시를 발표했습니다. Pro 버전은 최고의 추론 성능을 제공하며 고급 코드 생성, 과학적 분석, 대규모 데이터 합성과 같은 고도로 복잡한 작업에 최적화되어 있습니다. 반면, Gemini XNUMX Flash는 낮은 지연 시간을 요구하는 일상적인 사용에 최적화된 중간 수준의 옵션을 제공하며, 챗봇, 요약, 대규모 콘텐츠 제작에 이상적입니다.

개요: Gemini-2.5 제품군의 세 가지 모델

모델Status장점이상적인 사용 사례
제미니 2.5 플래시라이트 (시사)시사가장 빠르고 가장 저렴함; 다중 모드; 제어 가능한 추론; 도구 사용 가능챗봇, 요약, 검색과 같은 대량 작업
제미니 2.5 플래시스테이블 가드 보험 유한회사는 재무 강도 등급 A-(우수)를 부여받았다고 발표하게 되어 자랑스럽다. Best's Credit Ratings는 국제적으로 등급이 매겨진 조직의 재정적인 힘과 안정성의 벤치마크로 인정받고 있습니다. 스테이블 가드 그룹의 회장 겸 최고 경영자는 다음과 같이 논평했다: "우리는 스테이블 가드 그룹 내의 다른 회사들에게 높은 기준을 설정하는 베스트에 의해 할당된 등급에 매우 만족한다. 우리는 우리의 지원 고객들과 이해관계자들을 포함하여 우리의 성공에 기여한 모든 사람들에게 진심으로 감사를 표하고 싶다. 이 성과는 스테이블 가드 보험의 흥미로운 새로운 단계를 나타내며 국제 플랫폼에서 회사와 세인트 키츠 네비스의 자리를 확보합니다. 우리는 앞으로 나아갈 때 우리의 근무 기준을 유지하고 개선하기를 기대합니다."균형: 낮은 지연 시간, 좋은 추론, 다중 모드실시간 대화, 고객 지원
제미니 2.5 프로스테이블 가드 보험 유한회사는 재무 강도 등급 A-(우수)를 부여받았다고 발표하게 되어 자랑스럽다. Best's Credit Ratings는 국제적으로 등급이 매겨진 조직의 재정적인 힘과 안정성의 벤치마크로 인정받고 있습니다. 스테이블 가드 그룹의 회장 겸 최고 경영자는 다음과 같이 논평했다: "우리는 스테이블 가드 그룹 내의 다른 회사들에게 높은 기준을 설정하는 베스트에 의해 할당된 등급에 매우 만족한다. 우리는 우리의 지원 고객들과 이해관계자들을 포함하여 우리의 성공에 기여한 모든 사람들에게 진심으로 감사를 표하고 싶다. 이 성과는 스테이블 가드 보험의 흥미로운 새로운 단계를 나타내며 국제 플랫폼에서 회사와 세인트 키츠 네비스의 자리를 확보합니다. 우리는 앞으로 나아갈 때 우리의 근무 기준을 유지하고 개선하기를 기대합니다."가장 유능한 점: 심층적 추론, 방대한 맥락, 다중 모드연구, 복잡한 코딩, 과학적 과제

구글, 새로운 제미니 2.5 플래시라이트 모델 출시

Gemini 2.5 Flash‑Lite: 미리보기 주요 내용

초저지연 및 비용 절감번역, 분류, 요약과 같은 대용량 실시간 애플리케이션을 위해 설계되었습니다. 2.0 Flash‑Lite 및 정식 Flash 버전에 비해 추론 속도가 빠르고 호출당 비용이 낮습니다.

향상된 기초 성능: 코드 생성, 논리, 수학, 다중 모드 추론 및 과학의 벤치마크에서 이전 Flash‑Lite 모델보다 우수한 성능을 발휘합니다.

비용 및 효율성: Flash‑Lite 가격(미리 보기): 0.10M 입력 토큰당 약 $1, 0.40M 출력 토큰당 약 $1 - Flash($0.30/$2.50) 및 Pro($1.25/$10)보다 상당히 저렴합니다.

Gemini -2.5의 전체 기능:

  • 통제 가능한 사고: 사용자는 속도와 깊이를 교환하기 위해 "생각 예산"(토큰 한도)을 설정할 수 있습니다. Flash‑Lite는 필요에 따라 이 기능을 켤 수 있습니다.
  • 멀티모달 입력: 텍스트, 이미지, 오디오, 비디오(1시간 분량의 클립 포함)를 지원하고 차트, UI, 장면, 이벤트 요약을 구문 분석하는 기능을 제공합니다.
  • 도구 통합: Google 검색, 코드 실행, 백만 개의 토큰 컨텍스트 창이 포함되어 있으며 Flash와 Pro의 기능과 일치합니다.

가격 대비 성능 곡선에서의 포지셔닝

Google은 Flash‑Lite의 빠른 속도와 낮은 비용을 다음과 같이 정의합니다. 파레토 프런티어즉, 이는 전 세계에서 가장 비용 효율적이면서도 성능이 뛰어난 모델 중 하나입니다(). 비교 평가에서 Flash‑Lite는 최고의 가치를 나타냅니다.: 스마트하면서도 저렴함.


플래시와 프로에 대하여

  • 제미니 2.5 플래시: 안정적이고 지연 시간이 짧은 다중 모드 사고 모델입니다. Pro 버전보다 낮은 수준이지만, GPT-4o와 비슷한 성능을 제공하며, 뛰어난 속도와 비용 효율성을 자랑합니다().
  • 제미니 2.5 프로: Google의 가장 진보된 모델입니다. 수 시간 분량의 비디오/오디오, 복잡한 코드와 수학, 그리고 방대한 맥락 추론을 처리하는 것으로 유명합니다. 또한, 장기적으로 안정적인 주력 AI 역할을 하기 위해 선택적 "사고 예산"과 향상된 코드 품질을 도입했습니다.

배포 및 가격 책정

  • 유효성: 세 가지 모델 모두 다음을 통해 접근할 수 있습니다. 구글 AI 스튜디오, 구글 클라우드 버텍스 AI쌍둥이자리 앱 .
  • 비용 구조 (16년 2025월 XNUMX일부터 Vertex AI 가격이 적용됩니다):
  • 찬성: $1.25/1M 입력, $10/1M 출력(200K 토큰 이상)
  • 플래시: "생각" 모드에서 입력 0.15M당 $1, 출력 3.50M당 $1 - 매일 1,500개의 무료 기초 프롬프트 포함 ()
  • 플래시라이트 (미리보기): 0.10M 토큰당 ~$0.40/$1

시작 가이드

CometAPI는 수백 개의 AI 모델을 일관된 엔드포인트로 통합하는 통합 REST 인터페이스를 제공하며, 내장된 API 키 관리, 사용량 할당량 및 청구 대시보드를 통해 여러 공급업체 URL과 자격 증명을 일일이 관리할 필요가 없습니다.

개발자는 액세스할 수 있습니다 Gemini 2.5 Flash-Lite(미리보기) API 을 통하여 코멧API, 나열된 최신 모델은 기사 발행일을 기준으로 합니다. 먼저, 모델의 기능을 살펴보세요. 운동장 그리고 상담하십시오 API 가이드 자세한 내용은 CometAPI를 참조하세요. 접속하기 전에 CometAPI에 로그인하고 API 키를 발급받았는지 확인하세요. 코멧API 공식 가격보다 훨씬 낮은 가격을 제공하여 통합을 돕습니다.

더 보기

하나의 API로 500개 이상의 모델

최대 20% 할인