Jak korzystać z interfejsu API Seedgream 4.5

CometAPI
AnnaDec 9, 2025
Jak korzystać z interfejsu API Seedgream 4.5

Seedream 4.5 to najnowsza ewolucja rodziny Seedream, obejmująca modele tekst-do-obrazu / edycji obrazów (opracowane w ramach badań Byte/BytePlus). Jest wdrażany w oficjalnych punktach końcowych BytePlus oraz na wielu platformach zewnętrznych — w tym poprzez zintegrowany dostęp przez wielomodelowe bramki, takie jak CometAPI — i zapewnia lepszą spójność obiektu, typografię/renderowanie tekstu oraz większą wierność edycji w trybie multi-image.

Ten artykuł to praktyczny, profesjonalny przewodnik po korzystaniu z Seedream 4.5 API. Znajdziesz tu praktyczne kroki konfiguracji, uwierzytelnianie i wzorce żądań, najlepsze praktyki dotyczące promptów i parametrów, przepływy edycji i pracy z wieloma obrazami, obsługę błędów, wzorce wdrożeń oraz kwestie prawne/bezpieczeństwa.

Czym jest Seedream 4.5?

Seedream 4.5 to najnowsza iteracja rodziny Seedream — multimodalny model generowania i edycji obrazów zaprojektowany do wysokiej wierności generowania obrazów z tekstu oraz kontekstowej edycji obrazów (image-to-image, edycja z wieloma referencjami, inpainting/outpainting, typografia i obsługa gęstego tekstu). W porównaniu z wcześniejszymi wersjami Seedream, 4.5 skupia się na poprawie spójności obiektu w przepływach wieloobrazowych, rygorystyczniejszym zachowaniu detali referencyjnych, wyższej wierności typograficznej (tekst w obrazach) oraz lepszej jakości wyjścia do rozdzielczości 4K/ultra-HD w ustawieniach „high quality”. Ulepszenia te wynikają ze skalowanej architektury i zaktualizowanego strojenia promptów / heurystyk po stronie silnika.

Dlaczego to ważne: 4.5 jest celowo zbudowany do obsługi profesjonalnych zadań kreatywnych — seryjnych wariantów produktów, spójnych z marką edycji wieloobrazowych i materiałów do druku w wysokiej rozdzielczości — zapewniając jednocześnie większą kontrolę dzięki obrazom referencyjnym i specjalizowanym operacjom edycji.

Kluczowe możliwości

  • Generowanie tekst → obraz (pojedynczo i wsadowo): generuj 1–15 obrazów na wywołanie API, z wyborem trybów jakości (Basic vs High), które równoważą szybkość i rozdzielczość.
  • Edycja obrazu (i2i / inpainting / outpainting): używaj jednego lub wielu obrazów referencyjnych; zachowuje detale i relacje przestrzenne między wieloma referencjami.
  • Mieszanie z wieloma referencjami i kopiowanie elementów: do ~10 obrazów referencyjnych w jednym zadaniu, aby przenosić elementy przy zachowaniu spójnego oświetlenia/perspektywy.
  • Wysoka wierność typografii/gęstego tekstu: lepsza obsługa obrazów z tekstem lub oznakowaniem (przydatne do makiet, etykiet produktowych, zrzutów UI).
  • Strumieniowanie / wynik progresywny: niektóre punkty końcowe obsługują strumieniowanie wyników, dzięki czemu klienci mogą otrzymywać częściowe rezultaty w trakcie generowania.

Jak korzystać z Seedream 4.5 API przez CometAPI?

Poniżej znajdziesz praktyczny przewodnik do skopiowania i użycia, pokazujący generowanie obrazów przez CometAPI (agregator, który udostępnia model Seedream 4.5 jako parametr modelu). Używaj CometAPI, gdy chcesz jednym kluczem API uzyskać dostęp do dziesiątek/setek modeli i mieć stabilny, łatwy w integracji interfejs REST. Dokumentacja CometAPI pokazuje alias modelu doubao-seedream-4-5-251128 oraz standardowy punkt końcowy do generowania obrazów.

Kroki ogólne

  1. Zarejestruj się w CometAPI i pobierz klucz API.
  2. Użyj punktu końcowego generowania obrazów (POST https://api.cometapi.com/v1/images/generations) z parametrem model ustawionym na identyfikator Seedream 4.5 (przykład: doubao-seedream-4-5-251128).
  3. Dołącz prompt, opcjonalne obrazy referencyjne (URL-e lub przesyłki multipart, zależnie od agregatora), rozmiar/jakość wyjścia i inne parametry.
  4. Odbierz odpowiedź JSON zawierającą adresy URL wygenerowanych obrazów (lub base64) i metadane.

Typy żądań i tryby

Seedream 4.5 zazwyczaj obsługuje:

  • Tekst → Obraz (prompty tekstowe → nowe obrazy)
  • Obraz → Obraz (obrazy referencyjne + prompty do stylizowanych transformacji)
  • Edycja obrazu / Inpainting (maska + instrukcje edycji do ukierunkowanych zmian)
    hostowane API obsługują tryby asynchronicznych zadań (wyślij zadanie → odpytywanie z taskId), co pasuje do długotrwałych renderów i przepływów wsadowych. Generowane linki są często ograniczone czasowo (np. ważne 24 godziny w niektórych bramkach), więc zaplanuj przechowywanie/eksport.

Przykład curl (tekst → obraz, pojedynczy prompt)

curl -X POST "https://api.cometapi.com/v1/images/generations" \
  -H "Authorization: Bearer COMETAPI_KEY_GOES_HERE" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "doubao-seedream-4-5-251128",
    "prompt": "A cinematic portrait of a cyberpunk fox in neon rain, 4k, detailed lighting, film grain",
    "n": 3,
    "width": 2048,
    "height": 2048,
    "quality": "high",     # or "basic"
    "seed": 12345,
    "style": "photorealistic"
  }'

Uwagi

  • Zamień COMETAPI_KEY_GOES_HERE na swój klucz CometAPI.
  • Parametr n generuje wiele wariantów w jednym wywołaniu (oszczędność narzutu).
  • quality: "high" zazwyczaj odpowiada wyższej rozdzielczości / wyższemu kosztowi obliczeniowemu (często do 4K).

Przykład w Python requests (tekst → obraz + zapisywanie wyników)

import requests, base64, os

API_URL = "https://api.cometapi.com/v1/images/generations"
API_KEY = os.environ.get("COMETAPI_KEY")  # set env var for safety

payload = {
  "model": "doubao-seedream-4-5-251128",
  "prompt": "Studio shot of a ceramic mug on a wooden table, warm natural light, ultra-detailed, 2k",
  "n": 2,
  "width": 1024,
  "height": 1024,
  "quality": "basic"
}

resp = requests.post(API_URL, json=payload, headers={
    "Authorization": f"Bearer {API_KEY}",
    "Content-Type": "application/json"
})
resp.raise_for_status()
data = resp.json()

# Example: each item has 'b64_json' or 'url' depending on provider
for i, item in enumerate(data.get("data", [])):
    img_b64 = item.get("b64_json")
    if img_b64:
        img_bytes = base64.b64decode(img_b64)
        with open(f"seedream_result_{i}.png", "wb") as f:
            f.write(img_bytes)
    else:
        print("Image URL:", item.get("url"))

Dlaczego taki wzorzec? Agregatory często zwracają albo ładunek base64, albo hostowane URL-e; kod obsługuje oba przypadki. Punkt końcowy zwykle zwraca task_id. Odpytuj punkt GET /tasks/{task_id} aż status będzie succeeded, a następnie pobierz wynik. Wielu dostawców udostępnia SDK z pomocnikami wbudowanymi w ten wzorzec.

Jak zoptymalizować jakość obrazu i zachować czytelność tekstu?

  1. Używaj obrazów referencyjnych dla spójnego kontekstu i dopasowania kolorów.
  2. Wyraźnie określ typografię w promcie (krój pisma, grubość, wyrównanie) i rozważ dodanie dokładnego tekstu jako nakładki w drugim kroku, aby zapewnić czytelność.
  3. Uruchom proces dwuetapowy: (a) wygeneruj bazową kompozycję; (b) wyrenderuj ponownie lub edytuj w drugim przebiegu, koncentrując się na zbliżeniach lub obszarach etykiet w wyższej rozdzielczości.

Jak pisać prompty dla Seedream 4.5?

Zasady tworzenia promptów

  • Bądź precyzyjny: wymień obiekt, działanie, styl, obiektyw/aparat, porę dnia i preferowaną paletę kolorów.
  • Używaj kotwic tożsamości: jeśli potrzebujesz tej samej twarzy/rekwizytu w wielu obrazach, uwzględnij trwałe deskryptory (np. „ta sama kobieta z krótkimi falującymi włosami, zielona kurtka, blizna na lewym łuku brwiowym”) i dostarcz 1–3 obrazy referencyjne. Multi-reference fusion w Seedream 4.5 jest lepsze, ale kotwice pomagają.
  • Prompty negatywne: jasno określ, czego unikać (np. „bez tekstu”, „bez znaków wodnych”, „bez dodatkowych kończyn”).
  • Hybryda krótkie + długie: podaj krótką, kanoniczną instrukcję, a następnie rozszerz ją o kilka linijek szczegółów i ograniczeń.

Przykładowe szablony promptów

Ujęcie produktowe typu hero (fotorealistyczne): "Czyste ujęcie produktowe typu hero matowego czarnego głośnika bezprzewodowego na białym blacie, oświetlenie softbox, 50 mm, mała głębia ostrości, tło studyjne, fotorealistyczne, bez tekstu"

Ilustracja fantasy (stylizowana): "Epcki krajobraz fantasy, strzelisty szklany zamek na klifie, złota godzina, mgła wolumetryczna, malarskie, wysoce detaliczne, concept art"

Edycja obrazu (usuń obiekt) : "Usuń osobę po lewej i rozszerz tło, aby wypełnić przestrzeń, zachowaj spójne oświetlenie, bez artefaktów"

Mockup z dużą ilością tekstu: "Mockup ekranu strony startowej aplikacji mobilnej na iPhone 14, z tekstem 'Launch Now' krojem Gotham Bold, przycisk zielony, cienie miękkie"

Portret postaci: "Heroiczny portret wojowniczki, kinowe światło kontrowe, obiektyw portretowy 85 mm, ultra-szczegółowa faktura skóry, naturalne piegi, skórzana zbroja, neutralne tło, fotorealistyczne."

Prompty wieloobrazowe i referencyjne

Podczas korzystania z edycji z wieloma obrazami określ, który obraz referencyjny odpowiada której części promptu. Seedream 4.5 lepiej identyfikuje główny obiekt w wielu referencjach — ale bycie precyzyjnym (np. „użyj image_1 do twarzy, image_2 do faktury odzieży”) daje lepsze wyniki.

Wybór wyników i postprocessing

  • Wygeneruj N wariantów i uruchom obiektywne filtry: wynik podobieństwa twarzy, porównanie histogramów kolorów, OCR typografii, aby sprawdzić poprawność tekstu.
  • Zautomatyzuj progi kontroli jakości, by kierować wyniki poniżej progu do ręcznego retuszu.
  • Przenieś finalną typografię do narzędzi layoutu, jeśli potrzebujesz tekstu co do piksela — użyj modelu do tła i obrazów, a precyzyjny tekst dodaj w postprodukcji. Ogranicza to konieczność polegania na wierności tekstu modelu w materiałach marketingowych.

Jak wykonywać edycję, inpainting i kompozycję z wielu obrazów?

Przebieg pracy przy edycji obrazu

  1. Prześlij obraz(y) referencyjny(e) do dostawcy lub dołącz je w żądaniu.
  2. Dostarcz maskę (obraz binarny) do inpaintingu lub adnotację obszaru do ukierunkowanych edycji.
  3. Wyślij prompt edycji, precyzując, które obszary zmienić, a które zachować.

Wiele API obsługuje zarówno edycję pojedynczego obrazu, jak i kompozycję wieloobrazową; 4.5 jest wyraźnie dostrojony do zachowania tożsamości obiektu i poprawy spójności między obrazami.

Przykład: ładunek do inpaintingu (pseudokod JSON)

{
  "model": "seedream-4.5",
  "mode": "image_edit",
  "image_url": "https://.../original.png",
  "mask_url": "https://.../mask.png",
  "prompt": "Replace background with a sunset beach — keep subject untouched, maintain original lighting on subject",
  "guidance": 9,
  "steps": 40
}

Wskazówki dotyczące spójnej edycji wieloobrazowej

  • Używaj tego samego seed dla powiązanych renderów, by zachować spójność między klatkami.
  • Zachowaj spójne deskryptory kamery w promptach (np. „85 mm portret, softbox, 3/4”), aby utrzymać zgodność punktu widzenia.
  • Przy edycji twarzy żądaj zachowania szczegółów w wysokiej rozdzielczości („zachować strukturę twarzy, zmienić tylko kolor włosów”), by ograniczyć dryf tożsamości.

Najlepsze praktyki korzystania z Seedream 4.5

Jak rozwiązywać typowe problemy?

Oto praktyczne kroki rozwiązywania problemów, gdy wyniki odbiegają od oczekiwań:

Rozmyte twarze / błędne detale

Zwiększ precyzję promptu dla detali twarzy (wiek, wyraz twarzy, oświetlenie), dostarcz referencyjne obrazy wyższej jakości lub spróbuj wyraźnej instrukcji „zachowaj twarz” i obniż siłę edycji (strength), aby zachować więcej z oryginału. Seedream 4.5 poprawia realizm twarzy, ale jakość wejść nadal ma znaczenie.

Tekst jest nieczytelny lub zniekształcony

Dostarcz tekst wektorowy lub rastrowy jako oddzielną nakładkę, jeśli potrzebujesz typografii co do piksela; w przeciwnym razie użyj wyższych ustawień rozdzielczości i wyraźnych instrukcji w stylu „renderuj czytelny tekst: tak”. 4.5 lepiej radzi sobie z gęstym tekstem niż wcześniejsze wersje, ale perfekcja typograficzna może nadal wymagać kompozycji w postprodukcji.

Niespójne oświetlenie lub kompozycja w serii

Użyj szablonowego promptu z ustalonym oświetleniem/opisem kamery lub generuj w jednym wsadowym wywołaniu, aby zwiększyć spójność. BytePlus i CometAPI zapewniają wzorce inferencji wsadowej z tego powodu.

Uwagi końcowe i dalsze kroki

Seedream 4.5 to dojrzały, produkcyjny model obrazowy z wyraźnymi usprawnieniami ukierunkowanymi na realne przepływy kreatywne: lepsza spójność, ulepszone renderowanie tekstu i twarzy oraz wsparcie wielu referencji. Używaj CometAPI lub podobnych agregatorów, gdy chcesz szybkich eksperymentów i elastyczności wielomodelowej.

Deweloperzy mogą uzyskać dostęp do Seedream 4.5 przez CometAPI; najnowsza wersja modelu jest zawsze aktualizowana zgodnie z oficjalną stroną. Aby zacząć, poznaj możliwości modelu w Playground i zapoznaj się z przewodnikiem API po szczegóły. Przed dostępem upewnij się, że zalogowałeś się do CometAPI i uzyskałeś klucz API. CometAPI oferuje ceny znacznie niższe niż oficjalne, aby ułatwić integrację.

Gotowy do działania? → Bezpłatny okres próbny Seedream 4.5 !

Jeśli chcesz poznać więcej porad, przewodników i nowości o AI, obserwuj nas na VK, X i Discord!

Czytaj więcej

500+ modeli w jednym API

Do 20% zniżki