Home/Blog/활주로/gen4_image API
태그
gen-4_image
runway
runway-gen-4
하나의 채팅, 모든 것을 블렌드.한정 기간 무료
더 보기

하나의 API로 500개 이상의 모델

최대 20% 할인

활주로/gen4_image API

CometAPI
AnnaSep 13, 2025
활주로/gen4_image API

gen4_image Gen-4 제품군의 Runway의 주력 멀티모달 이미지 생성 모델입니다. 프롬프트 생성 및 시각적 참조 (참조 이미지를 "멘션"할 수 있음) 이미지 및 이미지→비디오 파이프라인에 대한 높은 제어성과 스타일적으로 일관된 출력을 생성합니다.

소개 - 무엇 Gen-4 이미지 is

gen4_image Runway의 4세대 시각적 생성 모델 제품군으로, 텍스트 프롬프트 + 시각적 참조 그리고 고화질 정지 이미지나 미디어에 적합한 프레임을 생성합니다. 정체 및 스타일 각도와 조명에 따라. 이 모델은 더 광범위한 Gen-4 제품군(예: 비디오 변형 포함)의 일부로 제공됩니다. gen4_turbo)이며 명시적으로 설계되었습니다. 창의적 생산 — 예를 들어, 일관된 캐릭터 렌더링, 대규모 제품 사진 촬영, 가상 체험, 게임 자산 생성 등이 있습니다.

주요 기능

  • 참조 기반 생성(1~3개 참조). 최대 3개의 참조 이미지를 사용하여 포즈, 조명, 배경 등을 변형하는 동안 모델의 정체성, 스타일 또는 위치를 유지할 수 있습니다.
  • 높은 시각적 충실도(제작에 바로 적용 가능한 출력물). 강력한 디테일과 스타일 제어 기능을 갖춘 고해상도(1080p 옵션 사용 가능)를 출력합니다.
  • 정체성과 장면의 일관성. 여러 세대에 걸쳐 동일한 캐릭터나 환경을 일관되게 유지하도록 설계되었습니다. 멀티 샷 비주얼이나 캐릭터 중심 자산에 유용합니다.
  • 다중 모달(텍스트 + 이미지) 프롬프트. 자연어 명령어와 참조 이미지를 결합하여 구성, 분위기, 의상, 카메라 각도 등을 조정합니다.
  • 이미지 → 이미지와 텍스트 → 이미지 워크플로. 연속성을 유지하기 위해 참조를 사용하여 이미지 대 이미지(편집/변환) 및 텍스트 대 이미지로 작동합니다.
  • 성능 등급(터보)이 가능합니다. "Gen-4 Image Turbo" 변형은 참조 기반 기능을 유지하면서 비용과 속도를 낮췄습니다(예: 약 2.5배 더 빠름).
  • 통제 및 재현성. 일반적인 API 옵션에는 종횡비 사전 설정, 해상도(720p/1080p), 재현성을 위한 시드, 특정 입력을 가리키는 참조 태그가 포함됩니다.

기술적 세부 사항

입력: 텍스트/이미지

출력 : 영상

워크 플로우 :

  1. 사용자 공급품: 텍스트 프롬프트 + 0~3개의 참조 이미지(선택 사항인 마스크, 키 프레임, 카메라 동작 지침).
  2. 전처리: 참조는 정규화되고 인코딩되며, 텍스트는 토큰화됩니다. ID/스타일 임베딩은 재사용을 위해 추출 및 캐시됩니다.
  3. 조절: 텍스트와 참조 임베딩은 멀티모달 백본에서 융합됩니다. 선택적 제어 신호(포즈, 깊이, 마스크)가 첨부됩니다.
  4. 샘플링/노이즈 제거: 디코더는 잡음 제거 반복(확산 단계)을 실행하여 이미지(또는 비디오의 프레임 시퀀스)를 생성합니다.

gen4_image — 구체적인 한계

시간적/동작적 에지 케이스. 리뷰어와 제작자는 가끔씩 모션 아티팩트, 이상한 시간적 역학(생성된 클립의 초기/후반부에 나타나는 오류), 매우 복잡한 여러 배우의 안무에서의 실패를 보고합니다. 대상 장면에서 테스트해 보세요.

컴퓨팅, 비용 및 대기열. 고품질 이미지→비디오 생성은 GPU 사용량이 많으므로, 사용자들은 대량 생산 시 대기 시간과 렌더링당 비용이 상당할 수 있다고 보고합니다. 이에 따라 예산/처리량을 계획하십시오.

창의적 균형과 순수한 예술적 모델. Gen-4의 장점은 일관성입니다. 고도로 양식화되고, 그림 같거나, "놀라운" 미적 결과물이 필요하다면 Midjourney나 조정된 SDXL 체크포인트가 선호하는 아트 방향을 만들어낼 수 있습니다.

정식 사용 사례

  • 사전 제작 및 스토리보딩: 참고 사진을 바탕으로 스타일이 일관된 캐릭터/장면 변형을 빠르게 생성합니다.
  • 마케팅 및 콘텐츠 생성: 일관된 브랜드 캐릭터를 활용하여 히어로 이미지, 애니메이션 소셜 클립, 캠페인 자산을 빠르게 제작합니다. (Runway는 라이브 투어와 뮤직 비디오를 포함한 기업 사례를 소개합니다.)
  • 게임/자산 프로토타입 제작 및 가상 체험: 소수의 참고 자료를 바탕으로 다양한 카메라 각도, 의상 변형, 환경 컨셉을 생성합니다.

다른 모델과의 비교

  • gen4_image→ 최고 필요할 때 참조/동일성 일관성 (단일 문자 또는 개체가 샷 전체에서 동일하게 유지됨) 및 원하는 경우 이미지→비디오 및 다중 샷 파이프라인.
  • DALL·E 3 → 베스트 엄격한 프롬프트-이미지 충실도와 대화형 ChatGPT 기반 편집 흐름, 그리고 내장된 안전/출처 확인 작업을 제공합니다.
  • SDXL(Stable Diffusion family) → 가장 좋음 개방형 모델, 로컬/맞춤형 미세 조정, 비용에 따른 유연한 배포가 필요한 경우.
  • Midjourney → 최고 높은 수준의 양식화와 예술적으로 만족스러운 렌더링, 그리고 강력한 커뮤니티 중심의 사전 설정/스타일화 컨트롤을 제공합니다.
  • Runway Gen-4 대 ByteDance Seedream 4.0 / Google "Nano Banana" 유형 모델: 최근 경쟁사 출시(예: Seedream 4.0)는 다음을 강조합니다. 초고속 렌더링 및 다중 참조 처리 상업 제작자를 대상으로 합니다. Runway의 장점은 긴밀하게 통합된 이미지→비디오 파이프라인과 제작 중심 제어, 그리고 성숙한 API와 SDK 생태계입니다.

전화하는 방법 gen4_image CometAPI의 API

가격$0.32000

필수 단계

  • 에 로그인 코메타피닷컴. 아직 당사 사용자가 아니신 경우 먼저 등록해 주시기 바랍니다.
  • 인터페이스의 액세스 자격 증명 API 키를 받으세요. 개인 센터의 API 토큰에서 "토큰 추가"를 클릭하고 토큰 키(sk-xxxxx)를 받아 제출하세요.
  • 이 사이트의 url을 받으세요: https://api.cometapi.com/

사용 방법

  1. API 요청을 전송하려면 "gen4_image" 엔드포인트를 선택하고 요청 본문을 설정하세요. 요청 메서드와 요청 본문은 웹사이트 API 문서에서 확인할 수 있습니다. 웹사이트에서는 사용자의 편의를 위해 Apifox 테스트도 제공합니다.
  2. 바꾸다 귀하 계정의 실제 CometAPI 키를 사용합니다.
  3. 질문이나 요청을 콘텐츠 필드에 입력하세요. 모델이 이에 응답합니다.
  4. . API 응답을 처리하여 생성된 답변을 얻습니다.

CometAPI는 완벽한 호환성을 갖춘 REST API를 제공하여 원활한 마이그레이션을 지원합니다. 주요 세부 정보는 다음과 같습니다.  API doc:

  • 종점 : https://api.cometapi.com/runwayml/v1/text_to_image
  • 모델 매개 변수 : gen4_image
  • 입증: Bearer YOUR_CometAPI_API_KEY
  • 컨텐츠 타입: application/json .
curl --location --request POST 'https://api.cometapi.com/runwayml/v1/text_to_image' \  
--header 'X-Runway-Version: 2024-11-06' \  
--header 'Authorization: {{api-key}}' \  
--header 'Content-Type: application/json' \  
--data-raw '{  
"promptText": "cat",  
"ratio": "1920:1080",  
"seed": 4294967295,  
"model": "gen4_image",  
"referenceImages": ,  
"contentModeration": {  
"publicFigureThreshold": "auto"  
}  
}'

참조 런웨이/2막