Nano Banana 2 — 커뮤니티가 Gemini 계열의 Google 최신 이미지 생성 모델을 지칭할 때 사용하는 약칭 — 은 빠르고 고충실도의 이미지 생성과 편집에 대한 기대치를 빠르게 재정립했다. 2026년 2월 말에 출시된 이 “Flash Image” 변종(Gemini 3.1 Flash Image / Nano Banana 2)은 높은 처리량과 낮은 지연에서 프로급 출력을 필요로 하는 개발자와 제품 팀을 대상으로 한다. 이 글에서는 최신 리포팅과 문서를 종합하여 Nano Banana 2가 무엇인지, 벤치마크 성능, 액세스 및 호출 방법(CometAPI 같은 서드파티 게이트웨이 포함), 그리고 프로덕션에서 적용할 수 있는 실용적인 프롬프트와 사용 패턴을 설명한다.
CometAPI는 일관된 엔드포인트 아래에서 많은 모델(이미지 모델 포함)을 노출하는 단일 HTTP 스타일 인터페이스를 제공한다. 이는 벤더 전환이나 여러 모델의 출력을 결합하는 일을 단순화할 수 있다. Nano Banana 2 (Gemini 3.1 Image)는 CometAPI에서 Live 상태다.
Nano Banana 2란?
Nano Banana 2(Gemini 3.1 Flash Image와 내부적으로 정렬됨)는 속도, 이미지당 낮은 비용, 창작 및 에디토리얼 이미지 작업에 대한 더 강한 지시 준수를 우선시하는 Google의 집중형, 고효율 이미지 생성 모델이다. 더 높은 충실도의 “Pro” 변종과 나란히 자리하도록 설계되었으며, Nano Banana 2는 고처리량을, Nano Banana Pro(Gemini 3 Pro Image)는 프리미엄, 에셋급 출력을 대상으로 한다.
이 모델은 다음을 제공하도록 설계되었다:
- 빠른 추론(매우 낮은 지연을 목표로 하여 이미지 생성과 편집이 거의 즉각적으로 느껴지도록 함).
- 높은 시각적 품질을 “Pro” 제품군에 근접하게 제공하면서도 더 낮은 연산/비용.
- 향상된 지시 준수(요청된 피사체, 이미지 내 텍스트, 다수 캐릭터 장면의 더 정확한 렌더링).
- 광범위한 해상도와 종횡비 지원, 빠른 작은 프리뷰부터 최종 에셋을 위한 네이티브 2K/4K 파이프라인까지.
Nano Banana 2는 기존 Nano Banana / Pro와 무엇이 다른가?
- 아키텍처 / 엔진: Gemini의 Flash 추론 스택(Gemini 3.1 Flash Image)을 기반으로 하여 일부 최대 품질 설정을 속도와 비용의 극적인 개선과 교환한다.
- 사용 사례: 대규모 자동화(마케팅 에셋, 썸네일, UI), 준 실시간 편집, 그리고 지연과 비용이 중요하면서도 여전히 Pro 수준의 피사체 충실도가 필요한 워크플로에 이상적이다.
Nano Banana 2의 벤치마크 성능

범주 전반에서의 일관성
Gemini 3.1 Flash Image는 Gemini 2.5 Flash 대비 보고된 모든 범주에서 측정 가능한 개선을 보여준다.
가장 큰 향상
- 시각적 품질
- 다중 입력 합성 편집
- 일반 편집 견고성
경쟁 포지셔닝
- 내부 GenAI-Bench 전반 선호도 리드.
- 전체 및 시각적 지표에서 GPT-Image 1.5를 상회.
- 소폭의 점진적 개선은 급진적 변화라기보다 아키텍처 정련을 시사.
Nano Banana 2는 어떻게 액세스할 수 있나?
제공 위치
Nano Banana 2는 Google의 Gemini 도구(Gemini 앱), Gemini API(Google의 AI 개발자 문서에 문서화됨)를 통해 접근 가능하며, Vertex AI 같은 클라우드 엔터프라이즈 제품을 통해 프리뷰/엔터프라이즈 통합으로 노출되고 있다. CometAPI 또한 손쉬운 통합을 위한 지원과 래퍼를 발표했다.
Nano Banana 2 API(cometapi) 사용 방법: 어떤 옵션이 있나?
CometAPI의 가이드는 Gemini 스타일의
generateContent형태를 사용하며, 이미지를candidates[0].content.parts[].inline_data.data내 Base64로 반환한다. 해당 Base64를 디코드하여 클라이언트 측에서 파일로 저장해야 한다.https: //generativelanguage.googleapis.com를https://api.cometapi.com로 바꾸기만 하면 된다. 반환된 이미지는 일반적으로 Base64로 인코딩된inline_data로 제공된다. 클라이언트 측에서 디코드하여 파일로 저장해야 한다. CometAPI는 할인 혜택을 제공하여 Nano Banana 2 API 사용을 돕는다.
CometAPI는 Gemini 모델을 위한 통합 REST 래퍼와 명시적 엔드포인트를 제공한다 — 하나의 자격 증명을 선호하고, 애플리케이션 코드를 변경하지 않고도 공급자를 전환하고 싶을 때 이상적이다. Nano Banana 2의 경우, CometAPI 페이지에는 gemini-3.1-flash-image-preview:generateContent 엔드포인트에 대한 직접 curl 스니펫이 포함되어 있다. 아래는 CometAPI 문서를 기반으로 정리한 curl 예시다.
CometAPI로 Nano Banana 2를 사용하기 위한 사전 준비
CometAPI 계정 및 API 키: CometAPI에서 계정을 생성하고 API 액세스 키(sk-…)를 발급받는다. 이 키는 CometAPI 엔드포인트에 대한 모든 API 요청 인증에 사용된다.
프로그래밍 언어 및 런타임:
- Node.js 18+ (JavaScript/TypeScript용)
- Python 3.10+
- (혹은 HTTP 요청을 보낼 수 있는 모든 언어)
HTTP 도구 또는 SDK:
- JavaScript:
fetch,axios, 또는 OpenAI 호환 클라이언트 - Python:
requests,httpx, 또는 OpenAI 클라이언트 - 이러한 도구는 API 호출을 전송하고 응답을 처리하는 데 도움이 된다.
요청 패턴의 간단 개요
- Base URL:
https://api.cometapi.com(CometAPI 기반). - 모델 이름:
gemini-3.1-flash-image-preview(Nano Banana 2 / gemini 3.1 Flash Image) 또는 가용성에 따라gemini-2.5-flash-image. - 인증:
Authorization: sk-xxxx헤더 — CometAPI는 일반적으로sk-스타일 키를 사용한다. - 응답: 이미지는
response.candidates[0].content.parts[].inline_data.data아래 Base64로 반환된다. 디코드하여 디스크에 기록한다.
예시 워크플로(상위 수준)
- CometAPI에서 API 키를 발급받는다.
- 모델 식별자를 선택한다(예: 가용성에 따라
gemini-3.1-flash-image또는 유사 모델). - 프롬프트와 함께 모델의 POST 요청 generate 엔드포인트를 호출한다.
- 앱에서 반환된 이미지 데이터를 처리한다(Base64 디코드, PNG로 제공 등).
- 이미지 편집의 경우, 요청에 기존 이미지 데이터와 편집 지시를 포함한다.
공식 Gemini API 사용(text → image)
아래는 gemini-3.1-flash-image-preview에 대해 Gemini generateContent 엔드포인트를 호출하는 짧은 Node.js 예시다(문서의 공식 스니펫을 반영). YOUR_API_KEY를 자격 증명으로 교체하고, 프로덕션에서는 에러 처리를 추가한다.
# Get your CometAPI key from https://api.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"
mkdir -p ./output
curl -s "https://api.cometapi.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent" \
-H "Authorization: $COMETAPI_KEY" \
-H 'Content-Type: application/json' \
-X POST \
-d '{
"contents": [
{
"role": "user",
"parts": [
{
"text": "A woman leaning on a wooden railing of a traditional Chinese building. She is wearing a blue cheongsam with pink and red floral motifs and a headdress made of colorful flowers, including roses and lilacs. Realistic painting style, focusing on the textural details of the clothing patterns and wooden buildings."
}
]
}
],
"generationConfig": {
"responseModalities": ["IMAGE"],
"imageConfig": {
"aspectRatio": "9:16"
}
}
}' | python3 -c "
import sys, json, base64
data = json.load(sys.stdin)
parts = data['candidates'][0]['content']['parts']
for part in parts:
if 'text' in part:
print(part['text'])
elif 'inlineData' in part:
img = base64.b64decode(part['inlineData']['data'])
with open('./output/gemini-3.1-flash-image-preview.png', 'wb') as f:
f.write(img)
print('Image saved to ./output/gemini-3.1-flash-image-preview.png')
"
CometAPI는 SDK와 OpenAI 호환 클라이언트 래퍼를 제공하므로, 일부 팀은 최소한의 코드 변경으로 공급자를 전환할 수 있으며, 설정에 따라 Base64 인코딩 이미지 출력 또는 호스팅된 URL을 요청할 수 있다. 정확한 페이로드 필드를 위해 항상 공식 generateContent 스키마를 확인하라.
Image→Image(편집) 플로우
기존 이미지를 편집하려면:
- 소스 이미지를 Base64로 변환한다(
data:image/...;base64,프리픽스 없이). inline_data.data에 해당 Base64 문자열과 편집 프롬프트(예: “배경을 석양 하늘로 변경, 워터마크 제거”)를 포함하여 POST한다.- 응답에는 디코드하여 저장할 새로운 Base64 출력이 포함된다.
curl
--location
--request POST 'https://api.cometapi.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent' \
--header 'Authorization: ' \
--header 'Content-Type: application/json' \
--data-raw '{ "contents":
[ { "role": "user", "parts":
[ { "text": "Blend three images to output a high-resolution image" }, { "inline_data": { "mime_type": "image/jpeg", "data": "<your_first_image_base64_data_here>" } }, { "inline_data": { "mime_type": "image/jpeg", "data": "<your_second_image_base64_data_here>" } }, { "inline_data": { "mime_type": "image/jpeg", "data": "<your_third_image_base64_data_here>" } }
] }
], "generationConfig": { "responseModalities": [ "TEXT", "IMAGE"
] } }'
일반적으로 조정하는 파라미터
model:gemini-3.1-flash-image-preview(Nano Banana 2) 또는gemini-3-pro-image-preview(Pro) 선택.imageConfig.aspect_ratio및imageConfig.image_size(512,1K,2K,4K) — 비용과 지연에 영향을 준다.responseModalities: 멀티모달 플로우의 경우["Image"]또는["Text","Image"].
Nano Banana 2에 대한 프롬프트는 어떻게 작성해야 하나?
이미지 모델을 위한 프롬프트 엔지니어링은 구도, 스타일, 카메라/라이팅 힌트, 제약 문장을 혼합한다. Nano Banana 2는 지시를 신뢰성 있게 따르도록 튜닝되어 있으므로, 간결함과 명시성을 균형 있게 유지하라.
권장 프롬프트 구조
- 주요 피사체: 이미지에 무엇/누가 있는지.
- 행동 또는 상태: 피사체가 무엇을 하는지.
- 환경 및 분위기: 배경, 조명, 분위기.
- 기술 지시: 카메라 렌즈, 종횡비, 해상도, 구도.
- 스타일 및 레퍼런스: 아트 스타일, 아티스트 레퍼런스(저작권 규정을 유의), 시대.
- 제약: 캐릭터/오브젝트 수, 특정 색상 회피, 읽기 쉬운 텍스트 포함.
예시 프롬프트:
“빈티지 로켓처럼 생긴 작은 노란 바나나가 햇살 가득한 스튜디오의 윤이 나는 마호가니 테이블 위에 놓여 있는 사실적인 이미지. 50mm 렌즈, 얕은 심도, 따뜻한 골든 아워 조명, 높은 디테일, 로고는 보이지 않게, 2048×1152.”
편집 프롬프트 팁(인페인팅 / 교체)
- 마스크를 명확히 제공하고 변경해야 할 영역을 지정하라.
- 유지해야 할 영역에는 “preserve” 표현을 사용하라(예: “피사체의 얼굴 특징 유지, 배경만 교체”).
- 이미지 내 텍스트의 경우 정확한 텍스트를 제공하고 폰트/스타일을 명시하라(예: “가독성 좋은 산세리프, 중앙 정렬”). Nano Banana 2는 더 나은 텍스트 렌더링을 강조하지만, 명확히 지시하라.
프롬프트 디버깅 체크리스트
- 출력이 엇나가면 단순화해보라: 먼저 창작 스타일 지시를 줄이고, 이후 디테일을 다시 도입한다.
- 텍스트가 읽기 어렵다면: 프롬프트에서 폰트, 크기, 대비를 명시하고 해상도를 높여라.
- 구도가 틀리다면: 카메라 앵글과 렌즈 지정자를 사용하라.
흔한 함정과 회피 방법은?
함정: 원샷 프롬프트에 과도한 의존
트리밍, 레이아웃, 다단계 편집을 단일 프롬프트로 해결할 것으로 기대하지 말라. 작업을 생성 기반 → 편집/교체 → 최종 다듬기의 단계로 나누라. 정밀도를 위해 시드와 마스크를 사용하라.
함정: 출처 및 저작권 검증 무시
SynthID/C2PA 등 출처 기능 없이 대규모 배포를 하지 말라. 많은 엔터프라이즈는 AI 생성 콘텐츠에 대한 추적 가능성을 요구한다.
함정: 예산 불시 소모
모델 및 엔드포인트 수준에서 사용량을 추적하고, 공급자 또는 프록시를 통해 하드 사용 한도를 설정하라. Flash 티어는 저렴하지만, 의도치 않게 4K 이미지를 수천 장 렌더링하면 비용이 크게 증가할 수 있다.
Nano Banana 2 권장 모범 사례?
이미지 생성의 프로덕션 적용에는 비용, 지연, 품질 관리, 출처 및 안전에 대한 주의가 필요하다. 아래는 현장 보고, Google 문서, 커뮤니티 테스트에서 추린 실용적 모범 사례다.
프롬프트 엔지니어링 & 결정적 출력
- 프롬프트를 템플릿화하라: 반복 가능한 출력(예: 상품 촬영)에는 고정된 세그먼트(피사체, 카메라, 조명, 질감, 후처리)를 갖춘 구조화된 프롬프트를 사용하라. 호출 간 드리프트를 줄일 수 있다.
- 참조 이미지와 마스크 지시를 사용해 편집하라: 순수 텍스트로 복잡한 국소 편집을 달성하려 하기보다, 의미적 오류와 아티팩트를 줄인다.
비용 & 성능 튜닝
- 대량 처리에는 Flash/“Nano Banana 2” 모드 선택: 빠른 반복이 많이 필요하다면 Flash 티어와 더 작은 크기(2K vs 4K)를 사용해 비용과 지연을 줄여라.
- 가능하면 요청 배치: 일부 공급자는 다중 프롬프트 배치를 허용한다 — 고처리량 파이프라인에서 에셋당 총 지연을 줄인다(공급자 문서 확인).
안전, 출처, 법적 고려
- 생성 에셋에 SynthID와 C2PA 메타데이터 활성화: 다운스트림 감사와 컴플라이언스를 지원(특히 광고/PR 활용 시). Google과 파트너는 출처 메커니즘으로 SynthID를 강조한다.
- 민감한 콘텐츠는 인간 검토 포함: 자동 정책 레이어가 강력하지만 완벽하지 않다 — 대중 노출 캠페인이나 공인 관련 콘텐츠에는 수동 검토를 사용하라.
품질 보증
- QA 체크 자동화: 생성 후 간단한 분류기로 예상치 못한 아티팩트(텍스트 오표기, 낮은 얼굴 충실도, 우발적 로고 생성)를 점검하라. 점수 시스템을 유지하고 자동 점검 실패 시 Pro 티어 렌더로 폴백하라.
- 프롬프트와 시드 저장: 감사성과 재현성을 위해 정확한 프롬프트, 타임스탬프, 모델 버전, 사용한 시드 또는 결정적 파라미터를 저장하라.
지연 민감 UX
- 점진적 UX: 저해상도/빠른 드래프트를 먼저 반환하고, 준비되면 고해상도/Pro 렌더로 교체하라. 앱의 반응성을 유지한다(많은 공급자가 “드래프트” 또는 Flash 변종을 제공).
마지막 메모 & 다음 단계
Nano Banana 2는 이미지 우선 프로덕션 워크플로의 경제성을 바꾸기 위해 설계되었다: 낮은 지연과 호출당 낮은 비용은 온디맨드 광고 에셋 생성, 빠른 A/B 크리에이티브 테스트, 실시간 협업 디자인 도구 같은 사용 사례를 가능하게 한다. 이 모델은 이미 Google의 소비자 및 클라우드 면에서 통합되어 있다; 빠르게 라이브로 가고 싶은 개발자에게는 CometAPI가 Gemini 이미지 엔드포인트와 기타 모델을 지원하는 편리한 마켓플레이스 래퍼를 제공한다 — 여러 엔진을 애플리케이션 코드를 바꾸지 않고 시도하려는 경우 실용적이다.
개발자는 CometAPI를 통해 지금 Nano Banana 2에 접근할 수 있다. 시작하려면 Playground에서 모델 기능을 탐색하고 자세한 지침은 API 가이드를 참조하라. 액세스 전에 CometAPI에 로그인하고 API 키를 발급받았는지 확인하라. CometAPI는 공식 가격보다 훨씬 낮은 가격을 제공해 통합을 돕는다.
Ready to Go?→ 오늘 바로 Nano Banana 2에 가입하세요 !
