Home/Models/Google/Nano Banana Pro
G

Nano Banana Pro

입력:$1.5616/M
출력:$9.3696/M
Nano Banana Pro는 텍스트 중심 워크플로에서 범용 지원을 제공하는 AI 모델이다. 구조를 제어할 수 있는 형태로 콘텐츠를 생성·변환·분석하기 위한 지시문 기반 프롬프팅에 적합하다. 주요 활용 사례로는 채팅 어시스턴트, 문서 요약, 지식 질의응답, 워크플로 자동화가 있다. 공개된 기술 세부 정보는 제한적이며; 통합 방식은 구조화된 출력, 검색 증강 프롬프트, 도구 또는 함수 호출 등 일반적인 AI 어시스턴트 패턴과 부합한다.
새로운
상업적 사용
Playground
개요
기능
가격
API
버전

기본 기능

  • Text → Image: 프롬프트 중심의 완전한 생성, 높은 프롬프트 준수도.
  • Image → Image(편집): 대상에 정확히 맞춘 정교한 편집, 여러 차례 편집에서도 주제/캐릭터 일관성 유지.
  • 최대 출력 해상도: 최대 4K(예시와 지원되는 정확한 픽셀 크기는 종횡비에 따라 달라짐; API는 1K/2K/4K 프리셋 제공)
  • 반복적 계획 및 자기 교정: 일반적인 시각적 오류(원근, 텍스트, 미세 기하)를 감지·수정하는 내부 “다단계” 파이프라인.
  • 고급 인-이미지 텍스트 렌더링: 포스터, 목업, 인포그래픽에 적합한 명확하고 가독성 높은 다국어 텍스트(짧은 캡션부터 긴 문단까지).
  • 5명의 캐릭터 및 단일 워크플로에서 최대 14개의 객체/참조 이미지에 대한 높은 충실도.
  • 워터마킹/출처: 생성된 모든 이미지에는 SynthID 워터마크가 포함되며, 일부 제품 통합에서는 출처 확인을 위한 C2PA 메타데이터를 내장.

Gemini 3 Pro Image 버전 및 네이밍

  • gemini-3-pro-image-preview
  • gemini-3-pro-image

기술 세부정보

아키텍처

  • 계보/백본: Nano Banana Pro는 Google의 발전 중인 Gemini 이미지 스택 — 특히 새로운 Gemini 3 Pro Image / GEMPIX 2 아키텍처(더 높은 용량의 이미지+텍스트 멀티모달 프레임워크) 위에 구축되었습니다. 이는 Gemini 2.5 Flash Image(원래의 “nano-banana”)에서 네이티브 멀티모달 이미지 모델로 진화하여 시각-언어 추론 능력이 확장된 형태입니다.
  • 모델 동작: 네이티브 멀티모달리티(이미지 + 텍스트 + 세계 지식), 다중 이미지 융합을 위한 명시적 파이프라인, 단일 정적 샘플을 한 번에 생성하는 대신 여러 패스를 거쳐 출력을 정제하는 내부 단계형 플래너를 갖추고 있습니다. 초기 보고에 따르면 이전 버전 대비 기하/광학(유리, 굴절) 추론이 강화되었습니다.
  • 사고/내부 정교화: 모델은 구성 정제를 위해 내부적으로 가시적인 “사고(thinking)” 과정을 사용합니다(이 동작은 API 문서에 기재되어 있으며, 이러한 내부 단계는 최종 이미지 토큰으로 과금되지 않습니다).
  • 그라운딩 및 도구: Search grounding을 지원하여 다이어그램/인포그래픽 생성에 웹 사실을 반영할 수 있습니다. 또한 보다 결정적인 제어를 위한 시스템 지시문도 지원합니다.

주요 API 매개변수:

  • thinking_level (low / high): 지연 시간과 추론 깊이 간의 트레이드오프를 제어;
  • media_resolution (low/medium/high): 이미지 OCR/세부 읽기 토큰 사용량을 제어;
  • generationConfig.imageConfig: 이미지 출력의 종횡비/해상도를 제어.

이미지 한도:

  • 지원되는 입력 모달리티: 텍스트와 이미지(이미지 생성 입력으로 오디오나 비디오는 허용되지 않음).
  • 프롬프트당 최대 이미지 수: 14개(Gemini 3 Pro Image preview 기준).
  • 최대 이미지 크기(업로드): 입력 이미지당 7 MB.
  • 지원되는 종횡비: 1:1, 3:2, 16:9, 9:16, 21:9 등.

출력 이미지 / 토큰: 높은 한도 제공, 4K/4096px 지원.

벤치마크 성능

요약: 현재까지의 공개/초기 벤치마크는 대부분 정성적·커뮤니티 주도이며, 원조 nano-banana(Gemini 2.5 Flash Image) 대비 해상도, 아티팩트 감소, 물리적 충실도에서 의미 있는 향상을 일관되게 보고합니다. 특정 명명된 “챌린지”에서는 뚜렷한 시각적 개선이 확인되었으나, 표준 이미지 생성 지표 전반에서 v1 → v2를 비교한 Google의 (공개) 표준화된 수치 벤치마크 표는 아직 없습니다.

  • 정성적 커뮤니티 테스트: 더 깔끔한 엣지, 더 선명한 미세 디테일, 더 정확한 색, 더 높은 프롬프트 준수도(환각 소품 감소, 캐릭터 일관성 향상). 비공식적으로 널리 쓰이는 테스트로 이른바 “Wine Glass Test”와 “Glass Burger Challenge”가 있으며, 여기서 GEMPIX2(Nano Banana Pro)는 이전 빌드보다 투명도와 굴절을 현저히 잘 처리합니다.
  • 텍스트 처리: Nano Banana Pro는 이미지 내 타이포그래피와 텍스트 배치가 눈에 띄게 개선되었습니다(많은 이미지 모델의 고질적 약점). 커뮤니티 비교에서는 깨진 글리프가 더 적게 렌더링되는 것으로 나타납니다.
  • 처리량/UX: 백엔드에서 다단계 정제를 수행해 반복 속도가 더 빠르고, 사용자가 더 신뢰할 수 있는 1차 결과를 보게 하는 UX(수동 재생성 감소).

제한사항 및 위험

  • 콘텐츠 필터 및 감지: 모델을 통합한 플랫폼(예: Whisk/서드파티 앱)은 엄격한 유명인/유사성 감지를 활성화해 특정 출력을 차단할 수 있으며, 이는 현실적인 유명인 유사성에 의존하는 크리에이티브 워크플로에 영향을 줄 수 있습니다.
  • 환각/추론 한계 사례: 개선되었지만, 여전히 물리적으로 비현실적인 아티팩트를 생성할 수 있습니다. 특히 이미지 내부의 밀집한 기호 텍스트나 고도로 기술적인 다이어그램에서 그러하며, NB2는 이전 버전 대비 이러한 오류를 줄인 것으로 보입니다.
  • 안전성 및 오남용: 생성형 이미지 모델은 문제적이거나 유해한 콘텐츠 제작에 사용될 수 있습니다. Google은 출처 확인을 돕기 위해 제약, 콘텐츠 필터, SynthID 워터마크를 적용하지만, 그럼에도 오남용 사례가 발생했습니다(정치적으로 민감한 상황에서 Nano Banana가 생성한 이미지와 관련된 주목할 만한 논란).

Nano Banana Pro와 다른 모델 비교

  • Nano Banana Pro (GEMPIX 2 / Gemini 3 Pro Image) — 강력한 모바일 통합, 다중 이미지 융합, 반복적 자기 교정, 2K 네이티브/4K 업스케일링, Google 앱(Search, Photos, Workspace/Gemini)과의 긴밀한 통합. 신뢰성 있는 편집, 연속성, Google 서비스 통합이 필요한 워크플로에 최적.
  • Midjourney — 스타일라이즈드 아트 출력과 커뮤니티 주도의 프롬프트 엔지니어링에 강점. 사진급 정확도의 다중 이미지 융합이나 심층 멀티모달 편집 파이프라인을 주 대상으로 하지는 않음.
  • Stable Diffusion / 오픈 가중치 — 완전히 개방적이고 높은 커스터마이즈 가능성, 로컬 호스팅 가능. 체크포인트와 파인튜닝 생태계는 연구 및 오프라인 사용에 결정적 이점. Nano Banana Pro에 비해 “원클릭” 모바일 통합과 기본 다중 이미지 편집 일관성은 다소 낮음.
  • Seedream 4.0 (ByteDance) — 최근 Nano Banana 경쟁자로 명확히 포지셔닝, 초고속 렌더링, 2K 출력, 다수의 참조 이미지(최대 6개) 지원을 강조. 프로/크리에이터 대안으로 자리매김.

(이 비교는 고수준 개요입니다. 워크플로에 맞춰 도구를 선택하세요: 개방성/커스터마이즈 → Stable Diffusion; 스타일라이즈드 아트 → Midjourney; 통합적이고 일관된 모바일 편집 및 공격적 반복 → Nano Banana Pro/ Gemini 3 Pro image 계열.)

실제 활용 사례

  • 모바일 사진 편집 & 크리에이티브 필터(Google Photos 통합 — 리스타일링, 배경 합성, 인물 재구성).
  • 마케팅 & 광고 에셋 — 빠른 콘셉트 생성, 다중 프레임/각도에서 일관된 브랜드 캐릭터.
  • 컨셉 아트 & 스토리보딩 — 다중 이미지 융합이 패널 전반의 캐릭터 연속성 유지에 기여.
  • 이커머스 / 제품 목업 — 다양한 컨텍스트/조명 조건에서 일관된 제품 샷 생성.
  • AR/VR 에셋의 신속한 프로토타이핑 — 몰입형 용도를 위해 업스케일 가능한 고품질 2K/4K 출력.
  • How to accessl gemini-3-pro-image(Nano Banana Pro) API

필수 단계

  • cometapi.com에 로그인하세요. 아직 사용자 계정이 없다면 먼저 등록하세요
  • 인터페이스의 액세스 자격 증명 API 키를 발급받으세요. 개인 센터의 API 토큰에서 “Add Token”을 클릭해 토큰 키: sk-xxxxx 를 받으면 제출하세요.
  • 다음 사이트 URL을 확인하세요: https://api.cometapi.com/

사용 방법

  1. “gemini-3-pro-image” 엔드포인트를 선택해 API 요청을 보내고 요청 본문을 설정하세요. 요청 방식과 요청 본문은 당사 웹사이트의 API 문서에서 확인할 수 있습니다. 편의를 위해 Apifox 테스트도 제공합니다.
  2. <YOUR_API_KEY>를 계정의 실제 CometAPI 키로 교체하세요.
  3. 질문이나 요청을 content 필드에 입력하세요—모델이 여기에 응답합니다.
  4. . 생성된 응답을 얻기 위해 API 응답을 처리하세요.

CometAPI는 완전 호환 REST API를 제공합니다—원활한 마이그레이션을 위해. 핵심 정보 :

  • 기본 URL: https://api.cometapi.com/v1beta/models/gemini-3-pro-image-preview:generateContent
  • 모델 이름: gemini-3-pro-image
  • 인증: Bearer YOUR_CometAPI_API_KEY header
  • Content-Type: application/json .

자주 묻는 질문

Gemini 3 Pro Image는 4K 해상도 이미지를 생성할 수 있나요?

예, Nano Banana Pro(Gemini 3 Pro Image)는 1:1, 3:2, 16:9, 9:16, 21:9 등의 화면비에서 최대 4K 해상도의 네이티브 출력을 지원합니다. 또한 imageConfig 매개변수를 통해 1K 및 2K 프리셋도 지원합니다.

Nano Banana Pro는 이미지 내부의 텍스트 렌더링을 어떻게 처리하나요?

Nano Banana Pro는 이미지 내 텍스트 렌더링에 대한 고급 기능을 제공하며, 짧은 캡션부터 긴 문단까지 선명하고 읽기 쉬운 다국어 텍스트를 지원합니다. 따라서 포스터, 인포그래픽, UI 목업, 마케팅 자산에 이상적입니다.

Gemini 3 Pro Image로 이미지를 대화형으로 편집할 수 있나요?

예, Nano Banana Pro는 멀티턴 대화형 편집을 지원합니다. '배경을 석양으로 바꿔줘'와 같은 변경 요청을 하면 모델이 턴 사이에서 Thought Signatures를 통해 시각적 맥락을 유지합니다.

Nano Banana Pro는 FLUX 2 Pro나 Midjourney와 무엇이 다른가요?

Nano Banana Pro는 반복적인 자기 수정, 여러 번의 편집에 걸친 일관된 캐릭터 보존, 그리고 긴밀한 Google 생태계 통합에서 강점을 보입니다. 복잡한 다중 이미지 융합 워크플로에서 최대 14장의 참조 이미지를 처리할 수 있습니다.

Nano Banana Pro는 근거 기반 이미지 생성을 위해 Google Search를 사용하나요?

예, Nano Banana Pro는 이미지를 생성하기 전에 사실을 검증하기 위해 Search grounding을 사용할 수 있습니다. 예를 들어, 정확한 도쿄 날씨 인포그래픽을 만들기 위해 현재 날씨 데이터를 가져올 수 있습니다.

Nano Banana Pro는 한 번의 요청에서 몇 장의 참조 이미지를 처리할 수 있나요?

Nano Banana Pro는 프롬프트당 최대 14장의 입력 이미지를 지원하며, 이미지당 최대 용량은 7MB입니다. 복잡한 다중 이미지 융합 시나리오에서 최대 5명의 인물에 대해 피사체 및 캐릭터의 일관성을 유지합니다.

Nano Banana Pro의 기능

[모델 이름]의 성능과 사용성을 향상시키도록 설계된 주요 기능을 살펴보세요. 이러한 기능이 프로젝트에 어떻게 도움이 되고 사용자 경험을 개선할 수 있는지 알아보세요.

Nano Banana Pro 가격

[모델명]의 경쟁력 있는 가격을 살펴보세요. 다양한 예산과 사용 요구에 맞게 설계되었습니다. 유연한 요금제로 사용한 만큼만 지불하므로 요구사항이 증가함에 따라 쉽게 확장할 수 있습니다. [모델명]이 비용을 관리 가능한 수준으로 유지하면서 프로젝트를 어떻게 향상시킬 수 있는지 알아보세요.

nano-banana-pro(image)

variant / aliasPrice
gemini-3-pro-image (1K/2K)≈ $0.10720
gemini-3-pro-image (4K)≈ $0.19200
gemini-3-pro-image-preview (1K/2K)≈ $0.10720
gemini-3-pro-image-preview (4K)≈ $0.19200
nano-banana-pro-all$0.09600

Nano Banana Pro의 샘플 코드 및 API

[모델 이름]의 포괄적인 샘플 코드와 API 리소스에 액세스하여 통합 프로세스를 간소화하세요. 자세한 문서는 단계별 가이드를 제공하여 프로젝트에서 [모델 이름]의 모든 잠재력을 활용할 수 있도록 돕습니다.
Python
JavaScript
Curl
from google import genai
from google.genai import types
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL, "timeout": 600000},
    api_key=COMETAPI_KEY,
)

prompt = "Da Vinci style anatomical sketch of a dissected Monarch butterfly. Detailed drawings of the head, wings, and legs on textured parchment with notes in English."
aspect_ratio = "1:1"  # "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9","21:9"
resolution = "4K"  # "1K", "2K", "4K"

response = client.models.generate_content(
    model="gemini-3-pro-image-preview",
    contents=prompt,
    config=types.GenerateContentConfig(
        response_modalities=["TEXT", "IMAGE"],
        image_config=types.ImageConfig(
            aspect_ratio=aspect_ratio,
            image_size=resolution,
        ),
    ),
)

# Output directory
OUTPUT_DIR = os.path.join(os.path.dirname(__file__), "..", "output")
os.makedirs(OUTPUT_DIR, exist_ok=True)

for part in response.parts:
    if part.text is not None:
        print(part.text)
    elif image := part.as_image():
        output_path = os.path.join(OUTPUT_DIR, "butterfly_4k.png")
        image.save(output_path)
        print(f"Image saved to: {output_path}")

Nano Banana Pro의 버전

Nano Banana Pro에 여러 스냅샷이 존재하는 이유는 업데이트 후 출력 변동으로 인해 일관성을 유지하기 위해 이전 스냅샷을 보관하거나, 개발자에게 적응 및 마이그레이션을 위한 전환 기간을 제공하거나, 글로벌 또는 지역별 엔드포인트에 따라 다양한 스냅샷을 제공하여 사용자 경험을 최적화하기 위한 것 등이 포함될 수 있습니다. 버전 간 상세한 차이점은 공식 문서를 참고해 주시기 바랍니다.
Model id설명가용성요청
nano-banana-pro-all사용된 기술은 비공식적이며 생성이 불안정합니다 등, Chat 형식✅Chat 형식
gemini-3-pro-image권장됨, 최신 모델을 가리킵니다✅Gemini 이미지 생성
gemini-3-pro-image-preview공식 프리뷰✅Gemini 이미지 생성

더 많은 모델