Gemini 2.5 플래시 이미지 API(나노-바나나)

CometAPI
AnnaSep 10, 2025
Gemini 2.5 플래시 이미지 API(나노-바나나)

Gemini 2.5 Flash Image(일명 "나노 바나나")는 Google의 Gemini 2.5 제품군에 포함된 최신 네이티브 이미지 생성 및 편집 모델입니다. 다중 이미지 융합, 정밀한 자연어 편집, 그리고 빠른 멀티모달 워크플로에 중점을 둡니다.

모델 소개

그것은 무엇입니까 — 제미니 2.5 플래시 이미지 Gemini 2.5 제품군을 기반으로 구축된 멀티모달 이미지 생성 및 편집 모델입니다. 사실적인 이미지, 수행하다 타겟 편집 (인페인팅, 스타일 전환, 객체 교환) 및 여러 소스 이미지 혼합 Gemini의 향상된 언어 추론 기능을 적용하여 구성과 의미론을 제어하면서 하나의 일관된 출력으로 변환합니다.

주요 기능

  • 네이티브 이미지 생성 및 편집 — 자연어 프롬프트를 통해 이미지를 생성하거나 기존 사진을 편집합니다. (생성/편집).
  • 다중 이미지 퓨전 — 여러 개의 입력 이미지를 하나의 사실적인 장면으로 결합합니다.
  • 캐릭터의 일관성 — 편집과 프롬프트에서 동일한 주제나 캐릭터 모습을 유지합니다. (일관성).
  • SynthID 워터마킹 — 모든 출력에는 다음이 포함됩니다. 보이지 않는 SynthID AI가 생성한 콘텐츠를 식별합니다. (양수표).

기술적 세부 사항

  • 아키텍처 및 위치: Gemini 2.5 Flash 제품군을 기반으로 설계되었습니다. 짧은 대기 시간 이전 플래시 계층보다 더 강력한 추론 기능을 유지하면서도 훨씬 빠른 호출당 응답과 비용 효율성을 위해 모델 크기/처리량을 약간 희생한 "플래시" 변형입니다.
  • 입력 형식 및 제한: 받아 들인다 인라인 base64 이미지 작은 입력 및 파일 업로드 대용량 이미지의 경우 파일 API를 통해 지원합니다(20MB 이상 권장). 일반적인 MIME 유형(JPEG, PNG)을 지원합니다.
  • 작동 모드: 텍스트-이미지 변환, 이미지 편집(인페인팅/의미적 마스킹), 스타일 전송, 다중 이미지 구성 및 인터리브 텍스트+이미지 응답(그림 설명, 요리법 또는 혼합 콘텐츠에 유용함).
  • 출처 및 안전 메커니즘: AI 출력에 눈에 보이는 워터마크와 숨겨진 SynthID 마커, 그리고 정책 시행 계층을 통해 명시적으로 허용되지 않는 콘텐츠를 제한합니다.

벤치마크 성능

Gemini 2.5 플래시 이미지 API(나노-바나나)

제한 사항 및 알려진 위험

  • 콘텐츠 정책 제약 사항: 모델은 콘텐츠 정책을 시행합니다(예: 노골적인 성적 콘텐츠 및 일부 불법 콘텐츠 금지) 하지만 시행이 완벽하지는 않습니다. 일부 시나리오에서는 여전히 대중 인물이나 논란의 여지가 있는 아이콘의 이미지를 생성할 수 있습니다. 정책 점검이 필수입니다. )
  • 실패 모드: 가능한 정체성 표류 극단적인 편집, 가끔씩 의미적 불일치(프롬프트가 충분히 지정되지 않은 경우), 매우 복잡한 장면이나 극단적인 시점 변경에서 아티팩트가 발생할 수 있습니다.
  • 출처 및 오용: 워터마크와 SynthID가 있지만, 이것들이 오용을 방지하지는 못합니다. 오용을 감지하고 귀속시키는 데 도움이 되지만 민감한 워크플로에서 사람의 검토를 대체할 수는 없습니다.

일반적인 사용 사례

  • 제품 및 전자상거래: 라이프스타일 샷에 제품 배치/카탈로그 작성 다중 이미지 융합을 통해.
  • 창의적인 도구/디자인: 빠른 반복 디자인 앱에서(Adobe Firefly 통합 인용).
  • 사진 편집 및 보정: 자연어에서 현지화된 편집 (객체 제거, 색상/조명 변경, 스타일 변경).
  • 스토리텔링/캐릭터 자산: 캐릭터의 일관성을 유지하세요 패널과 장면을 통해.

전화하는 방법 제미니 2.5 플래시 이미지 CometAPI의 API

Gemini 2.5 Flash Image CometAPI의 API 가격 책정, 공식 가격 대비 20% 할인:

가격$0.3120

필수 단계

  • 에 로그인 코메타피닷컴. 아직 당사 사용자가 아니신 경우 먼저 등록해 주시기 바랍니다.
  • 인터페이스의 액세스 자격 증명 API 키를 받으세요. 개인 센터의 API 토큰에서 "토큰 추가"를 클릭하고 토큰 키(sk-xxxxx)를 받아 제출하세요.
  • 이 사이트의 url을 받으세요: https://api.cometapi.com/

사용 방법

  1. "Gemini-2.5 Flash-ImageAPI 요청을 전송하고 요청 본문을 설정하는 엔드포인트입니다. 요청 메서드와 요청 본문은 웹사이트 API 문서에서 확인할 수 있습니다. 웹사이트에서는 사용자의 편의를 위해 Apifox 테스트도 제공합니다.
  2. 바꾸다 귀하 계정의 실제 CometAPI 키를 사용합니다.
  3. 질문이나 요청을 콘텐츠 필드에 입력하세요. 모델이 이에 응답합니다.
  4. . API 응답을 처리하여 생성된 답변을 얻습니다.

CometAPI는 완벽한 호환성을 갖춘 REST API를 제공하여 원활한 마이그레이션을 지원합니다. 주요 세부 정보는 다음과 같습니다.  API doc:

  • 종점 : https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent
  • 모델 매개 변수 : 제미니-2.5-플래시-이미지-미리보기 / 제미니-2.5-플래시-이미지
  • 입증: Bearer YOUR_CometAPI_API_KEY
  • 컨텐츠 타입: application/json .

참고: API를 호출할 때 매개변수 "stream"을 true로 설정하세요.

curl --location --request POST 'https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent' \
--header 'Authorization: sk-xxx' \
--header 'User-Agent: Apidog/1.0.0 (https://apidog.com)' \
--header 'Content-Type: application/json' \
--header 'Accept: */*' \
--header 'Host: api.cometapi.com' \
--header 'Connection: keep-alive' \
--data-raw '{
    "contents": [
        {
            "role": "user",
            "parts": [
                {
                    "text": "cat"
                },
                {
                    "inline_data": {
                        "mime_type": "image/jpeg",
						"data": "iVBORw0KGgoA Note: Base64 data here"
						}

            ]
        }
    ],
    "generationConfig": {
        "responseModalities": [
            "TEXT",
            "IMAGE"
        ]
    }
}'

도 참조 GPT-이미지-1 API

SHARE THIS BLOG

하나의 API로 500개 이상의 모델

최대 20% 할인