API를 통해 Nano Banana를 사용하는 방법?(Gemini-2-5-flash-image)

CometAPI
AnnaDec 10, 2025
API를 통해 Nano Banana를 사용하는 방법?(Gemini-2-5-flash-image)

Nano Banana Google의 커뮤니티 별명(및 내부 약어)입니다. 제미니 2.5 플래시 이미지 — 고품질, 저지연 멀티모달 이미지 생성 + 편집 모델입니다. 이 장문 가이드(코드, 패턴, 배포 단계 및 CometAPI 예제 포함)는 프로덕션 환경에서 사용할 수 있는 세 가지 실용적인 호출 메서드를 보여줍니다. (1) OpenAI 호환 채팅 인터페이스(텍스트→이미지), (2) Google 공식 generateContent 텍스트→이미지 인터페이스, 그리고 (3) 구글 공식 generateContent Base64 입출력을 사용하는 이미지→이미지 인터페이스입니다. 이 과정에서 배포/배포에 대한 단계별 조언, 환경 설정, CometAPI에서 API 작업을 가져오는 방법, 가격 및 워터마크 관련 참고 사항, 그리고 안정적이고 비용 효율적인 결과를 위한 최고의 팁을 제공합니다.

나노 바나나(제미니 2.5 플래시 이미지)란 ​​무엇인가요?

나노 바나나는 구글의 제미니 제품군에 포함된 최신 이미지 모델인 제미니 2.5 플래시 이미지의 비공식적인 이름입니다. 사실적인 이미지 생성과 정밀한 이미지 편집(로컬 편집, 다중 이미지 융합, 편집 과정 전반의 일관된 문자 보존)을 위해 설계되었으며, 구글 제미니 API, 구글 AI 스튜디오, 그리고 버텍스 AI를 통해 제공됩니다. 이 모델은 출처를 확인할 수 있도록 눈에 보이지 않는 SynthID 워터마크가 함께 제공됩니다.

개발자에게 중요한 이유: Nano Banana는 다음을 처리할 수 있는 단일 고품질 다중 모달 모델을 제공합니다.

  • 텍스트 → 이미지 (텍스트 프롬프트에서 새로운 이미지 생성)
  • 이미지 → 이미지 (제공된 사진을 편집/변환)
  • 다중 이미지 블렌딩 (여러 장의 사진을 하나의 합성으로 합치다)
    이 모든 것은 Google의 공식을 통해 접근할 수 있습니다. generateContent 엔드포인트(Vertex AI/Gemini API) 또는 CometAPI 및 OpenRouter와 같은 타사 API 게이트웨이에서 제공하는 OpenAI 호환 엔드포인트를 통해 사용할 수 있습니다. 즉, Gemini 2.5 Flash Image를 기존 OpenAI 호환 코드베이스에 통합하거나 Google 공식 SDK를 직접 호출할 수 있습니다.

그것이 탁월한 점

  • 타겟이 지정된 로컬 편집(셔츠 색상 변경, 객체 제거, 포즈 조정).
  • 재편집 시에도 주제/등장인물의 일관성을 유지합니다.
  • 여러 이미지를 일관된 합성물로 혼합/병합합니다.
  • 더 무거운 연구 모델에 비해 지연 시간이 짧고 추론 비용 효율성이 높습니다(Google에서는 "플래시" 모델을 고처리량 옵션으로 분류합니다).

API를 통해 Nano Banana를 호출하려면 개발 환경을 어떻게 설정해야 합니까?

아래에는 나중에 설명하는 세 가지 호출 방법에 대한 기준으로 사용할 수 있는 단계별 체크리스트가 나와 있습니다.

필수 구성 요소(계정, 키, 할당량)

  1. Google 계정 + 클라우드 프로젝트 — Google(Gemini API/Vertex AI)을 통해 Gemini를 직접 호출하려면 Google Cloud 프로젝트를 생성하고 Vertex AI/Gemini API를 활성화하세요. 결제 및 적절한 역할(예: Vertex AI Admin or Service Account (추론 권한 포함).
  2. 제미니 API 접근 — 일부 Gemini 이미지 모델은 미리 보기/제한된 제공량입니다. 계정에 따라 Google AI Studio 또는 Vertex AI를 통해 액세스를 요청하거나 모델을 사용해야 할 수도 있습니다.
  3. CometAPI(선택적 게이트웨이) — 다양한 모델(Gemini 포함)을 프록시할 수 있는 단일 벤더 독립 API를 선호하신다면 CometAPI에 가입하여 API 키를 받고 모델 목록을 검토하세요(Gemini 2.5 Flash 버전과 OpenAI 호환 엔드포인트를 제공합니다). CometAPI는 개발을 간소화하고 앱 코드를 변경하지 않고도 벤더를 변경할 수 있도록 지원합니다.

로컬 툴링

  • 언어 런타임: Node.js 18+, Python 3.10+ 권장.
  • HTTP 클라이언트: fetch/axios JS의 경우; requests/httpx Python(또는 공식 SDK)용.
  • 이미지 도우미: Pillow (파이썬) 또는 sharp (노드) 크기 조정, 형식 변환, Base64 인코딩/디코딩을 위한 것입니다.
  • 보안: 환경 변수나 비밀 저장소(HashiCorp Vault, AWS Secrets Manager, Google Secret Manager)에 키를 저장합니다. API 키는 절대 커밋하지 마세요.

Google/호환 SDK 설치(선택 사항)

Google은 SDK를 제공합니다. openai 라이브러리 호환성 심(Shim) — 몇 줄(기본 URL + API 키)만 변경하면 Gemini에 OpenAI 클라이언트 라이브러리를 사용할 수 있지만, 완전한 멀티모달 기능을 위해서는 기본 Gemini/Google 클라이언트를 사용하는 것이 좋습니다. CometAPI 또는 OpenAI 호환 게이트웨이를 사용하는 경우, OpenAI 클라이언트를 사용하면 개발 속도를 높일 수 있습니다. 예:

공식 Google 경로(Python):

python -m venv venv && source venv/bin/activate
pip install --upgrade pip
pip install google-genai           # official Google GenAI SDK

pip install Pillow requests jq     # for local image handling in examples

CometAPI / OpenAI 호환 클라이언트(Python):

pip install openai requests

나노 바나나의 세 가지 통화 방법 중에서 어떻게 선택해야 하나요?

호출 방식 선택은 아키텍처, 지연 시간/비용 요구 사항, 그리고 Google 공식 엔드포인트를 사용할지 아니면 타사 OpenAI 호환 게이트웨이를 사용할지 여부에 따라 달라집니다. 세 가지 일반적인 패턴은 다음과 같습니다.

1) OpenAI 호환 채팅 인터페이스(텍스트-이미지 변환)

이미 OpenAI 스타일 코드나 SDK가 있고 최소한의 변경으로 모델을 전환하려는 경우 이 기능을 사용하세요. 많은 게이트웨이(CometAPI, OpenRouter)가 OpenAI 호환 REST 인터페이스 아래에 Gemini 모델을 노출하므로 기존 chat or completions 호출은 다른 것과 함께 작동합니다. base_url 및 모델 이름입니다. Google Cloud 인증을 관리하지 않으려는 경우 프로덕션으로 가는 가장 빠른 경로입니다.

2) 쌍둥이자리 공무원 generateContent — 텍스트-이미지 변환

Google의 공식을 사용하세요 generateContent 를 통해 genai 공식적이고 완벽하게 지원되는 SDK와 최신 기능(세밀한 생성 매개변수, 스트리밍, 대규모 애셋용 파일 API)에 대한 액세스를 원하고 Google Cloud 청구/모니터링 기능을 이용하고 싶다면 (Google) 클라이언트 또는 Vertex AI를 선택하세요. 프로덕션 지원과 엔터프라이즈급 제어 기능이 필요한 경우 권장됩니다.

3) 쌍둥이자리 공무원 generateContent — 이미지-이미지(Base64 입력/출력)

바이너리 이미지를 인라인(Base64)으로 제출해야 하거나 이미지 편집/이미지-이미지 파이프라인이 필요할 때 이 기능을 사용하세요. Google의 generateContent 인라인(base64) 이미지와 대용량 또는 재사용 가능한 에셋을 위한 파일 API를 지원합니다. 생성/편집된 이미지에 대한 응답은 일반적으로 디코딩하여 저장하는 Base64 문자열로 반환됩니다. 이를 통해 가장 명확한 다중 모드 제어가 가능합니다.

OpenAI 호환 채팅 인터페이스(텍스트-이미지)를 통해 Nano Banana를 호출하려면 어떻게 해야 하나요?

OpenAI 호환 채팅 엔드포인트는 다음 시퀀스를 허용합니다. {role, content} 메시지입니다. 사용자 메시지에 어떤 이미지를 포함할지 설명하면 게이트웨이(CometAPI 또는 OpenAI 호환 심)가 이를 기본 Gemini 모델 호출로 변환합니다. 앱에서 이미 채팅 흐름을 사용하거나 텍스트 생성과 이미지 생성을 단일 교환으로 결합하려는 경우 이 방식이 편리합니다.

단계

1.CometAPI에 가입하고 API 키를 받으세요: CometAPI에 등록하고, 프로젝트를 생성하고, API 키를 복사하세요. CometAPI는 단일 API 뒤에 다양한 모델을 제공합니다. base_url. ()

  1. OpenAI 호환 클라이언트 설치: 파이썬: pip install openai 또는 최신 버전을 사용하세요 openai/OpenAI 많은 게이트웨이에서 사용되는 SDK 래퍼입니다.

  2. SDK를 CometAPI로 지정하고 채팅 완료 엔드포인트를 호출합니다.:

curl https://api.cometapi.com/v1/chat/completions \
  -H "Authorization: Bearer $COMET_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gemini-2-5-flash-image-preview",
     "stream": true,   
     "messages": [{"role": "user", 
                   "content": "Generate a cute kitten sitting on a cloud, in a                cartoon style"}]
      }'

배송 시 요청 사항:

  1. stream은 true여야 합니다. 응답은 스트림으로 반환됩니다.

  2. 응답 구조는 OpenAI와의 호환성을 위해 CometAPI로 래핑됩니다.

  3. 응답에는 Base64 이미지가 포함됩니다. 필요에 따라 이를 디코딩하여 클라이언트에 저장합니다.

제미니 공식을 사용하여 나노 바나나를 호출하려면 어떻게 해야 합니까? generateContent 텍스트-이미지 인터페이스?

Google에서 제공합니다 제미니 개발자 API (Gemini API) 및 다음을 통해 Gemini 모델도 노출합니다. 버텍스 AI. 지원되는 방식으로 Gemini 2.5 Flash Image(Nano Banana)에 프로그래밍 방식으로 액세스하려면 공식 generateContent 메서드는 텍스트 전용 또는 다중 모드 생성을 위한 표준 진입점입니다. Google의 GenAI SDK (파이썬: google-genai) 또는 REST 엔드포인트를 직접 호출합니다. 이를 통해 모델의 매개변수와 모달리티에 직접 액세스할 수 있으며, Google 엔드포인트를 호출할 때 고급 기능(정밀 편집, 다중 이미지 융합)을 사용하는 데 권장되는 방법입니다.

  1. Google을 사용하세요 GenAI SDK (파이썬: google-genai)

배포/통화 단계(개요):

  1. API 키 받기 Google AI Studio에서 설정하거나 Vertex AI 서비스 계정을 설정합니다(플랫폼에 따라 다름).
  2. SDK 설치 (pip install --upgrade google-genai)을 인증합니다(API 키 또는 Google 애플리케이션 기본 자격 증명).
  3. 왼쪽 메뉴에서 모델: gemini-2.5-flash-image 또는 문서에 표시된 미리보기 슬러그(정확한 슬러그는 GA/미리보기 상태에 따라 다름).
  4. 상담 예약 번호 client.models.generate_content(...) 일반 텍스트 프롬프트(텍스트-이미지 변환)를 사용합니다.
  5. 디코드 반환된 이미지(Base64가 반환된 경우)를 저장/보관합니다.

Python(공식 클라이언트) 예제 — 텍스트→이미지:

from google import genai
from base64 import b64decode, b64encode

client = genai.Client(api_key="YOUR_GEMINI_KEY")
prompt = {
  "content": "A hyperrealistic photo of a vintage motorcycle parked under neon lights at midnight",
  "mime_type": "text/plain"
}
# request generateContent for image output

result = client.generate_content(
  model="gemini-2-5-flash-image-preview",
  prompt=prompt,
  response_modalities=,
  image_format="PNG",
)
# handle binary or base64 in response (depends on API mode)

(참고: 정확한 매개변수 이름은 공식 클라이언트 API에서 확인하세요. 위의 예시는 Google 문서의 패턴을 따릅니다.)

2. 요구 나노 바난 REST 엔드포인트를 통해

EST 엔드포인트(텍스트-이미지 변환 예): https://api.CometAPI.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent.

인증 옵션: 헤더 제공 x-goog-api-key: $CometAPI_API_KEY. (CometAPI에서 키를 생성합니다.)

이는 텍스트 프롬프트를 게시하고 반환된 base64 이미지를 저장합니다.

curl -s -X POST \
  "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{
      "parts": [
        { "text": "A photorealistic nano banana dish plated in a stylish restaurant, cinematic lighting, 3:2 aspect ratio" }
      ]
    }]
  }' \
| jq -r '.candidates.content.parts[] | select(.inline_data) | .inline_data.data' \
| base64 --decode > gemini-image.png

참고사항: 이미지 바이너리는 base64로 반환됩니다. candidates.content.parts.inline_data.data. 위의 예에서는 다음을 사용합니다. jq 인라인 데이터를 가져와서 디코딩합니다. 공식 문서에서도 같은 흐름이 표시됩니다.

제미니 공식을 사용하여 나노 바나나를 호출하려면 어떻게 해야 합니까? generateContent 이미지-이미지 인터페이스(Base64 입/출력)?

언제 이미지-이미지(base64 입/출력)를 사용해야 합니까?

다음과 같은 경우 이미지-이미지를 사용하세요.

  • 기존 사진을 편집합니다(인페인팅, 스타일 전송, 객체 교체).
  • 여러 소스 이미지를 하나의 작품으로 결합합니다.
  • 편집 과정에서 주제의 정체성을 보존합니다(나노 바나나의 장점 중 하나).

쌍둥이 자리 generateContent Base64(또는 파일 URI)를 통해 인라인 이미지 데이터를 지원하고 생성되거나 편집된 이미지를 Base64 문자열로 반환합니다. 문서에서는 이를 제공하기 위한 구체적인 예를 제공합니다. inline_datamime_typedata.

배포/호출 단계(이미지-이미지)

  1. Prepare 입력 이미지: SDK 도우미를 통해 파일 바이트 읽기, Base64 인코딩 또는 원시 바이트 전달.
  2. 건설하다 a contents 한 부분이 인라인 이미지인 배열( mimeTypedata) 및 후속 부분에는 텍스트 편집 지침이 포함되어 있습니다.
  3. POSTgenerateContent (공식 SDK 또는 REST).
  4. 수신 응답: API는 Base64 문자열로 인코딩된 생성/편집된 이미지를 반환합니다. 이를 디코딩하여 로컬에 저장합니다.

예 - Python(GenAI SDK를 통한 인라인 바이트를 사용한 이미지-이미지 변환)

# pip install google-genai

from google import genai
from google.genai import types
import base64

client = genai.Client(api_key="YOUR_GOOGLE_API_KEY")

# Read local image

with open("input_photo.jpg", "rb") as f:
    img_bytes = f.read()

# Using SDK helper to attach bytes as a part

response = client.models.generate_content(
    model="gemini-2.5-flash-image-preview",
    contents=[
        types.Part.from_bytes(
            data=img_bytes,
            mime_type="image/jpeg"
        ),
        "Make a high-quality edit: change the subject's jacket color to teal, keep natural lighting and preserve the person's facial features."
    ],
)

# The returned image will typically be in response.candidates[].content.parts with base64-encoded data

# Decode and save (pseudo-access shown; check SDK response structure)
b64_out = response.candidates.content.parts.data  # example path

with open("edited.jpg","wb") as out:
    out.write(base64.b64decode(b64_out))

Python 예제: Base64를 통한 rest point를 통한 image→image

import base64, json, requests

API_URL = "https://api.gemini.googleapis.com/v1/generateContent"
API_KEY = "YOUR_GEMINI_KEY"

# read and base64-encode image

with open("input.jpg","rb") as f:
    b64 = base64.b64encode(f.read()).decode("utf-8")

payload = {
  "model": "gemini-2-5-flash-image-preview",
  "input": [
    {"mime_type": "image/jpeg", "bytes_base64": b64},
    {"mime_type": "text/plain", "text": "Remove the lamppost and make the sky golden at sunset."}
  ],
  "response_modalities": 
}

resp = requests.post(API_URL, headers={"Authorization":f"Bearer {API_KEY}", "Content-Type":"application/json"}, json=payload)
resp.raise_for_status()
data = resp.json()
# data.candidates... may contain image base64 — decode and save

out_b64 = data
with open("edited.png","wb") as out:
    out.write(base64.b64decode(out_b64))

CometAPI rest port를 사용하여 액세스하려면:

curl 
--location 
--request POST "https://api.CometAPI.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent" ^ 
--header "Authorization: sk-" ^ 
--header "User-Agent: Apifox/1.0.0 (https://apifox.com)" ^ 
--header "Content-Type: application/json" ^ 
--header "Accept: */*" ^ 
--header "Host: api.CometAPI.com" ^ 
--header "Connection: keep-alive" ^ 
--data-raw "{ \"contents\":  } ], \"generationConfig\": { \"responseModalities\":  }}"

인라인: 이미지를 읽고 base64로 인코딩합니다. 반복 사용 또는 20MB 이상인 경우, 파일 API를 통해 업로드하고 파일 핸들을 참조하세요. generateContent정확한 편집과 입력 이미지와 텍스트 편집 지침이 필요한 워크플로에 가장 적합합니다.

나노 바나나를 사용할 때 가장 좋은 팁은 무엇인가요?

신속한 엔지니어링 및 제어

  1. 명시적이어야 합니다.: 원하는 종횡비, 스타일 참조(아티스트 이름만 허용된 경우), 카메라 렌즈, 조명 및 구도를 포함합니다. 예: "사실적인 사진, 3:2, 얕은 피사계 심도, 골든 아워, 니콘 50mm 렌즈."
  2. 연속 편집을 사용하세요: 대규모 단일 샷 프롬프트보다 여러 번에 걸쳐 소규모의 부분적인 편집을 선호합니다. 이렇게 하면 주제의 일관성을 유지할 수 있습니다. 나노 바나나의 강점은 반복적인 편집입니다.

이미지 위생

  • 입력을 사전 처리합니다. 색상 공간을 정규화하고, 개인 정보 보호가 필요한 경우 내장된 EXIF를 제거하고, 토큰을 저장하기 위해 적절한 해상도로 조정합니다.
  • 후처리 출력: 얼굴 감지를 실행하고, 가벼운 필터(Pillow/Sharp)를 통해 사소한 아티팩트를 정리한 후 사용자에게 반환합니다.

안전, 규정 준수 및 콘텐츠 정책

  • 이미지를 저장/제공하기 전에 자동화된 콘텐츠 안전 검사(Vision 검토 모델 또는 블랙리스트 검사)를 구현합니다.
  • 사람 이미지를 업로드하는 경우 해당 개인정보 보호법(GDPR/CCPA)을 준수하고 필요한 동의를 받으세요.
  • 저작권이 있는 캐릭터나 기존 아트워크를 사용할 때는 모델 사용 정책과 저작권 규칙을 존중하세요.

결산 메모

Nano Banana(Gemini 2.5 Flash Image)는 다중 모드 이미지 생성 및 편집을 위한 실용적이고 충실도가 높은 단계를 나타냅니다. 편집 간의 일관성과 보다 풍부한 다중 모드 추론을 위해 설계되었습니다. Nano Banana(Gemini 2.5 Flash Image)는 다중 단계 편집 및 여러 통합 표면(CometAPI 및 Google의 OpenAI 호환 게이트웨이와 같은)에 대해 높은 일관성을 제공하는 이미지 생성/편집의 중요한 단계입니다. generateContent API). 채택 속도를 높이기 위해 CometAPI와 같은 게이트웨이를 사용하면 OpenAI 스타일 코드를 재사용할 수 있습니다. 항상 정신 건강 검사 응답을 제공하고, 콘텐츠 정책 및 출처 기능(SynthID)을 존중하고, 반복 작업 중에 비용을 모니터링하세요.

시작 가이드

CometAPI는 OpenAI의 GPT 시리즈, Google의 Gemini, Anthropic의 Claude, Midjourney, Suno 등 주요 공급업체의 500개 이상의 AI 모델을 단일 개발자 친화적인 인터페이스로 통합하는 통합 API 플랫폼입니다. CometAPI는 일관된 인증, 요청 형식 지정 및 응답 처리를 제공하여 애플리케이션에 AI 기능을 통합하는 과정을 획기적으로 간소화합니다. 챗봇, 이미지 생성기, 음악 작곡가 또는 데이터 기반 분석 파이프라인 등 어떤 제품을 구축하든 CometAPI를 사용하면 AI 생태계 전반의 최신 혁신 기술을 활용하면서 반복 작업을 더 빠르게 수행하고 비용을 관리하며 공급업체에 구애받지 않을 수 있습니다.

개발자는 액세스할 수 있습니다 제미니 2.5 플래시 이미지(나노 바나나 코멧 API 목록 gemini-2.5-flash-image-preview/gemini-2.5-flash-image (카탈로그의 스타일 항목 참조) CometAPI를 통해 나열된 최신 모델 버전은 문서 발행일을 기준으로 합니다. 시작하려면 모델의 기능을 살펴보세요. 운동장 그리고 상담하십시오 API 가이드 자세한 내용은 CometAPI를 참조하세요. 접속하기 전에 CometAPI에 로그인하고 API 키를 발급받았는지 확인하세요. 코멧API 공식 가격보다 훨씬 낮은 가격을 제공하여 통합을 돕습니다.

SHARE THIS BLOG

하나의 API로 500개 이상의 모델

최대 20% 할인