O

GPT-5.2 Pro

Bối cảnh:400,000
Đầu vào:$12.00/M
Đầu ra:$96.00/M
gpt-5.2-pro là thành viên hướng tới môi trường sản xuất có năng lực cao nhất trong dòng GPT-5.2 của OpenAI, được cung cấp qua Responses API cho các khối lượng công việc đòi hỏi độ trung thực tối đa, suy luận nhiều bước, sử dụng công cụ rộng rãi và các hạn mức ngữ cảnh/thông lượng lớn nhất mà OpenAI cung cấp.
O

GPT-5.2 Chat

Bối cảnh:128,000
Đầu vào:$1.40/M
Đầu ra:$11.20/M
gpt-5.2-chat-latest là bản snapshot được tối ưu cho trò chuyện của dòng GPT-5.2 của OpenAI (được đặt tên trong ChatGPT là GPT-5.2 Instant). Đây là mô hình dành cho các trường hợp sử dụng tương tác/trò chuyện cần sự kết hợp giữa tốc độ, khả năng xử lý ngữ cảnh dài, đầu vào đa mô thức và hành vi hội thoại đáng tin cậy.
O

GPT-5.2

Bối cảnh:400,000
Đầu vào:$1.40/M
Đầu ra:$11.20/M
GPT-5.2 là bộ mô hình đa biến thể (Instant, Thinking, Pro) được thiết kế nhằm mang lại khả năng hiểu ngữ cảnh dài tốt hơn, khả năng lập trình và sử dụng công cụ mạnh hơn, và hiệu năng cao hơn đáng kể trên các chuẩn đánh giá “knowledge-work” ở mức chuyên nghiệp.
O

GPT-5.1 Chat

Bối cảnh:400.0k
Đầu vào:$1.00/M
Đầu ra:$8.00/M
GPT-5.1 Chat là mô hình ngôn ngữ hội thoại được tinh chỉnh theo chỉ dẫn cho các mục đích chung về trò chuyện, suy luận và viết. Nó hỗ trợ đối thoại nhiều lượt, tóm tắt, soạn thảo, hỏi-đáp dựa trên cơ sở tri thức, và hỗ trợ viết mã nhẹ cho các trợ lý trong ứng dụng, tự động hóa hỗ trợ, và trợ lý đồng hành cho quy trình làm việc. Các điểm nổi bật kỹ thuật bao gồm căn chỉnh tối ưu cho hội thoại, đầu ra có thể kiểm soát và có cấu trúc, cùng các lộ trình tích hợp để gọi công cụ và quy trình truy xuất khi khả dụng.
O

GPT-5.1

Đầu vào:$1.00/M
Đầu ra:$8.00/M
GPT-5.1 là một mô hình ngôn ngữ mục đích chung được tinh chỉnh theo hướng dẫn, tập trung vào việc tạo văn bản và suy luận trên các quy trình làm việc của sản phẩm. Mô hình hỗ trợ đối thoại đa lượt, định dạng đầu ra có cấu trúc, và các tác vụ hướng mã như soạn thảo, tái cấu trúc và giải thích. Các trường hợp sử dụng điển hình bao gồm trợ lý trò chuyện, Hỏi đáp tăng cường truy hồi, chuyển đổi dữ liệu, và tự động hóa kiểu tác tử với công cụ hoặc API khi được hỗ trợ. Những điểm nổi bật về kỹ thuật bao gồm chế độ lấy văn bản làm trung tâm, khả năng tuân theo hướng dẫn, đầu ra theo kiểu JSON, và khả năng tương thích với việc gọi hàm trong các khung điều phối phổ biến.
O

GPT-5 nano

Bối cảnh:400K
Đầu vào:$0.04/M
Đầu ra:$0.32/M
GPT-5 Nano là một mô hình trí tuệ nhân tạo do OpenAI cung cấp.
O

GPT-5 mini

Bối cảnh:400K
Đầu vào:$0.20/M
Đầu ra:$1.60/M
GPT-5 mini là thành viên trong gia đình GPT-5 của OpenAI, được tối ưu hóa về chi phí và độ trễ, nhằm mang lại phần lớn các năng lực đa phương thức và khả năng làm theo hướng dẫn của GPT-5 với chi phí thấp hơn đáng kể cho việc sử dụng ở quy mô sản xuất lớn. Sản phẩm hướng tới các môi trường mà thông lượng, mức định giá theo mỗi token có thể dự đoán trước và phản hồi nhanh là những ràng buộc chính, đồng thời vẫn cung cấp các khả năng tổng quát mạnh mẽ.
O

GPT 5 Chat

Bối cảnh:400K
Đầu vào:$1.00/M
Đầu ra:$8.00/M
GPT-5 Chat (mới nhất) là một mô hình trí tuệ nhân tạo được OpenAI cung cấp.
O

GPT-5

Bối cảnh:400K
Đầu vào:$1.00/M
Đầu ra:$8.00/M
GPT-5 là mô hình viết mã mạnh mẽ nhất của OpenAI cho đến nay. Nó cho thấy những cải tiến đáng kể trong việc tạo giao diện front-end phức tạp và gỡ lỗi trong các codebase lớn. Nó có thể biến ý tưởng thành hiện thực với kết quả trực quan và giàu tính thẩm mỹ, tạo ra các trang web, ứng dụng và trò chơi đẹp, đáp ứng tốt với cảm quan thẩm mỹ tinh tế, tất cả chỉ từ một lời nhắc duy nhất. Những người thử nghiệm sớm cũng ghi nhận các lựa chọn thiết kế của nó, với sự hiểu biết sâu hơn về các yếu tố như khoảng cách, kiểu chữ và khoảng trắng.
O

GPT-4.1 nano

Bối cảnh:1.0M
Đầu vào:$0.08/M
Đầu ra:$0.32/M
GPT-4.1 nano là một mô hình trí tuệ nhân tạo do OpenAI cung cấp. gpt-4.1-nano: Có cửa sổ ngữ cảnh lớn hơn—hỗ trợ tới 1 triệu token ngữ cảnh và tận dụng ngữ cảnh đó tốt hơn nhờ khả năng hiểu ngữ cảnh dài được cải thiện. Có mốc kiến thức được cập nhật là tháng 6 năm 2024. Mô hình này hỗ trợ độ dài ngữ cảnh tối đa là 1,047,576 token.
O

GPT-4.1

Bối cảnh:1.0M
Đầu vào:$1.60/M
Đầu ra:$6.40/M
GPT-4.1 là một mô hình trí tuệ nhân tạo do OpenAI cung cấp. gpt-4.1-nano: Có cửa sổ ngữ cảnh lớn hơn—hỗ trợ tới 1 triệu token ngữ cảnh và có khả năng tận dụng tốt hơn ngữ cảnh đó nhờ khả năng hiểu ngữ cảnh dài được cải thiện. Có mốc kiến thức được cập nhật đến tháng 6 năm 2024. Mô hình này hỗ trợ độ dài ngữ cảnh tối đa 1,047,576 token.
O

GPT-4o mini

Đầu vào:$0.12/M
Đầu ra:$0.48/M
GPT-4o mini là một mô hình trí tuệ nhân tạo do OpenAI cung cấp.
O

Whisper-1

Đầu vào:$24.00/M
Đầu ra:$24.00/M
Chuyển giọng nói thành văn bản, tạo bản dịch
O

TTS

Đầu vào:$12.00/M
Đầu ra:$12.00/M
OpenAI Text-to-Speech
O

Sora 2 Pro

Mỗi Giây:$0.24
Sora 2 Pro là mô hình tạo sinh đa phương tiện tiên tiến và mạnh mẽ nhất của chúng tôi, có khả năng tạo video với âm thanh được đồng bộ hóa. Nó có thể tạo các đoạn video chi tiết, sinh động từ ngôn ngữ tự nhiên hoặc hình ảnh.
O

Sora 2

Mỗi Giây:$0.08
Mô hình tạo video siêu mạnh mẽ, kèm hiệu ứng âm thanh, hỗ trợ định dạng chat.
O

GPT Image 1 mini

Đầu vào:$2.00/M
Đầu ra:$6.40/M
Phiên bản tối ưu hóa chi phí của GPT Image 1. Đây là một mô hình ngôn ngữ đa phương thức gốc, nhận cả văn bản và hình ảnh làm đầu vào và tạo đầu ra là hình ảnh.
O

GPT 4.1 mini

Bối cảnh:1.0M
Đầu vào:$0.32/M
Đầu ra:$1.28/M
GPT-4.1 mini là một mô hình trí tuệ nhân tạo do OpenAI cung cấp. gpt-4.1-mini: Một bước nhảy vọt đáng kể về hiệu năng của mô hình nhỏ, thậm chí vượt qua GPT-4o trong nhiều bài đánh giá điểm chuẩn. Nó đạt hoặc vượt GPT-4o trong các đánh giá trí tuệ, đồng thời giảm độ trễ gần một nửa và chi phí tới 83%. Mô hình này hỗ trợ độ dài ngữ cảnh tối đa là 1,047,576 token.
O

o4-mini-deep-research

Bối cảnh:200K
Đầu vào:$1.60/M
Đầu ra:$6.40/M
O4-Mini-Deep-Research là mô hình suy luận tác tử mới nhất của OpenAI, kết hợp kiến trúc xương sống o4-mini gọn nhẹ với khung Deep Research tiên tiến. Được thiết kế để cung cấp khả năng tổng hợp thông tin chuyên sâu nhanh chóng, hiệu quả về chi phí, mô hình này cho phép các nhà phát triển và nhà nghiên cứu thực hiện tìm kiếm web tự động, phân tích dữ liệu và lập luận theo chuỗi chỉ trong một lần gọi API duy nhất.
O

o4-mini

Đầu vào:$0.88/M
Đầu ra:$3.52/M
O4-mini là một mô hình trí tuệ nhân tạo do OpenAI cung cấp.
O

O3 Pro

Bối cảnh:200K
Đầu vào:$16.00/M
Đầu ra:$64.00/M
OpenAI o3‑pro là biến thể “pro” của mô hình suy luận o3, được thiết kế để suy nghĩ lâu hơn và cung cấp các phản hồi đáng tin cậy nhất bằng cách áp dụng học tăng cường chuỗi tư duy riêng tư và thiết lập các chuẩn mực tối tân mới trên các lĩnh vực như khoa học, lập trình và kinh doanh—đồng thời tự động tích hợp các công cụ như tìm kiếm web, phân tích tệp, thực thi Python và suy luận thị giác ngay trong API.
O

o3-mini

Đầu vào:$0.88/M
Đầu ra:$3.52/M
O3-mini là một mô hình trí tuệ nhân tạo do OpenAI cung cấp.
O

o3-deep-research

Đầu vào:$8.00/M
Đầu ra:$32.00/M
Một tác nhân nghiên cứu chuyên sâu có kết nối mạng, dựa trên mô hình O3, hỗ trợ suy luận nhiều bước và các báo cáo phân tích trích dẫn.
O

o3

Đầu vào:$1.60/M
Đầu ra:$6.40/M
O3 là một mô hình trí tuệ nhân tạo do OpenAI cung cấp.
O

GPT-4o mini Audio

Đầu vào:$0.12/M
Đầu ra:$0.48/M
GPT-4o mini Audio là một mô hình đa phương thức dành cho các tương tác bằng giọng nói và văn bản. Nó thực hiện nhận dạng giọng nói, dịch và chuyển văn bản thành giọng nói, tuân theo chỉ dẫn, và có thể gọi các công cụ để thực hiện các hành động có cấu trúc với phản hồi theo luồng. Các trường hợp sử dụng điển hình bao gồm trợ lý giọng nói thời gian thực, phụ đề và dịch trực tiếp, tóm tắt cuộc gọi, và các ứng dụng điều khiển bằng giọng nói. Các điểm nổi bật về kỹ thuật bao gồm đầu vào và đầu ra âm thanh, phản hồi theo luồng, gọi hàm, và xuất JSON có cấu trúc.
O

codex-mini-latest

Đầu vào:$1.20/M
Đầu ra:$4.80/M
Codex Mini là một mô hình trí tuệ nhân tạo do OpenAI cung cấp. Đây là thành tựu mới nhất của OpenAI trong lĩnh vực sinh mã, một mô hình nhẹ được tối ưu hóa đặc biệt cho giao diện dòng lệnh Codex (CLI). Là phiên bản đã được tinh chỉnh từ o4-mini, mô hình này kế thừa hiệu suất cao và tốc độ phản hồi của mô hình gốc, đồng thời được tối ưu hóa đặc biệt cho việc hiểu và sinh mã.
O

GPT-4o mini TTS

Đầu vào:$9.60/M
Đầu ra:$38.40/M
GPT-4o mini TTS là một mô hình chuyển văn bản thành giọng nói dựa trên mạng nơ-ron, được thiết kế để tạo giọng nói tự nhiên với độ trễ thấp cho các ứng dụng hướng tới người dùng. Nó chuyển văn bản thành giọng nói tự nhiên với các giọng đọc có thể lựa chọn, đầu ra đa định dạng và khả năng tổng hợp theo luồng để mang lại trải nghiệm phản hồi nhanh. Các trường hợp sử dụng điển hình bao gồm trợ lý giọng nói, IVR và luồng liên hệ, tính năng đọc to thông tin sản phẩm và thuyết minh nội dung truyền thông. Các điểm nổi bật về kỹ thuật bao gồm truyền phát theo luồng dựa trên API và xuất ra các định dạng âm thanh phổ biến như MP3 và WAV.
O

GPT-4o Realtime

Đầu vào:$60.00/M
Đầu ra:$240.00/M
Realtime API cho phép các nhà phát triển xây dựng các trải nghiệm đa phương thức có độ trễ thấp, bao gồm chức năng chuyển đổi giọng nói sang giọng nói. Văn bản và âm thanh được Realtime API xử lý được tính phí riêng biệt. Mô hình này hỗ trợ độ dài ngữ cảnh tối đa 128,000 token.
O

GPT-4o Search

Đầu vào:$60.00/M
Đầu ra:$60.00/M
GPT-4o Search là một mô hình đa phương thức dựa trên GPT-4o, được cấu hình cho khả năng suy luận được tăng cường bởi tìm kiếm và cung cấp các câu trả lời có căn cứ, cập nhật. Nó tuân theo hướng dẫn và sử dụng các công cụ tìm kiếm trên web để truy xuất, đánh giá và tổng hợp thông tin bên ngoài, kèm ngữ cảnh nguồn khi sẵn có. Các trường hợp sử dụng điển hình bao gồm hỗ trợ nghiên cứu, kiểm chứng thông tin, theo dõi tin tức và xu hướng, và trả lời các truy vấn nhạy cảm về thời gian. Các điểm nổi bật về kỹ thuật bao gồm khả năng gọi công cụ/hàm phục vụ việc duyệt và truy xuất, xử lý ngữ cảnh dài, và đầu ra có cấu trúc phù hợp cho trích dẫn và liên kết.
O

ChatGPT-4o

Đầu vào:$4.00/M
Đầu ra:$12.00/M
Dựa trên phiên bản mới nhất của GPT-4o, một mô hình ngôn ngữ lớn (LLM) đa phương thức hỗ trợ đầu vào/đầu ra văn bản, hình ảnh, âm thanh và video.
O

tts-1-hd-1106

Đầu vào:$24.00/M
Đầu ra:$24.00/M
O

tts-1-hd

Đầu vào:$24.00/M
Đầu ra:$24.00/M
O

tts-1-1106

Đầu vào:$12.00/M
Đầu ra:$12.00/M
O

tts-1

Đầu vào:$12.00/M
Đầu ra:$12.00/M
O

text-embedding-ada-002

Đầu vào:$0.08/M
Đầu ra:$0.08/M
An Ada-based text embedding model optimized for various NLP tasks.
O

text-embedding-3-small

Đầu vào:$0.02/M
Đầu ra:$0.02/M
A small text embedding model for efficient processing.
O

text-embedding-3-large

Đầu vào:$0.10/M
Đầu ra:$0.10/M
A large text embedding model for a wide range of natural language processing tasks.
O

omni-moderation-latest

Theo Yêu cầu:$0.00
O

omni-moderation-2024-09-26

Theo Yêu cầu:$0.00
O

o1-pro-all

Đầu vào:$120.00/M
Đầu ra:$480.00/M
O

o1-pro-2025-03-19

Đầu vào:$120.00/M
Đầu ra:$480.00/M
O

o1-pro

Đầu vào:$120.00/M
Đầu ra:$480.00/M
O1-pro is an artificial intelligence model provided by OpenAI.
O

o1-preview-all

Theo Yêu cầu:$0.16
O

o1-preview-2024-09-12

Đầu vào:$12.00/M
Đầu ra:$48.00/M
O

o1-preview

Đầu vào:$12.00/M
Đầu ra:$48.00/M
O1-preview is an artificial intelligence model provided by OpenAI.
O

o1-mini-all

Theo Yêu cầu:$0.08
O

o1-mini-2024-09-12

Đầu vào:$0.88/M
Đầu ra:$3.52/M
O

o1-mini

Đầu vào:$0.88/M
Đầu ra:$3.52/M
O1-mini is an artificial intelligence model provided by OpenAI.
O

o1-all

Theo Yêu cầu:$0.16
O

o1-2024-12-17

Đầu vào:$12.00/M
Đầu ra:$48.00/M
O

o1

Đầu vào:$12.00/M
Đầu ra:$48.00/M
O1 is an artificial intelligence model provided by OpenAI.
O

gpt-realtime-mini

Đầu vào:$0.48/M
Đầu ra:$0.96/M
Phiên bản tiết kiệm chi phí của GPT thời gian thực — có khả năng phản hồi đầu vào âm thanh và văn bản theo thời gian thực thông qua các kết nối WebRTC, WebSocket hoặc SIP.
C

gpt-oss-20b

Đầu vào:$0.08/M
Đầu ra:$0.32/M
gpt-oss-20b is an artificial intelligence model provided by cloudflare-workers-ai.
C

gpt-oss-120b

Đầu vào:$0.16/M
Đầu ra:$0.80/M
gpt-oss-120b is an artificial intelligence model provided by cloudflare-workers-ai.
O

gpt-image-1

Đầu vào:$8.00/M
Đầu ra:$32.00/M
An advanced AI model for generating images from text descriptions.
O

gpt-4o-all

Đầu vào:$2.00/M
Đầu ra:$8.00/M
<div>GPT-4o is OpenAI's most advanced Multimodal model, faster and cheaper than GPT-4 Turbo, with stronger visual capabilities. This model has a 128K context and a knowledge cutoff of October 2023. Models in the 1106 series and above support tool_calls and function_call.</div> This model supports a maximum context length of 128,000 tokens.
O

gpt-4-vision-preview

Đầu vào:$2.00/M
Đầu ra:$8.00/M
This model supports a maximum context length of 128,000 tokens.
O

gpt-4-vision

Đầu vào:$8.00/M
Đầu ra:$24.00/M
This model supports a maximum context length of 128,000 tokens.
O

gpt-4-v

Theo Yêu cầu:$0.04
O

gpt-4-turbo-preview

Đầu vào:$8.00/M
Đầu ra:$24.00/M
<div>gpt-4-turbo-preview Upgraded version, stronger code generation capabilities, reduced model "laziness", fixed non-English UTF-8 generation issues.</div> This model supports a maximum context length of 128,000 tokens.
O

gpt-4-turbo-2024-04-09

Đầu vào:$8.00/M
Đầu ra:$24.00/M
<div>gpt-4-turbo-2024-04-09 Upgraded version, stronger code generation capabilities, reduced model "laziness", fixed non-English UTF-8 generation issues.</div> This model supports a maximum context length of 128,000 tokens.
O

gpt-4-turbo

Đầu vào:$8.00/M
Đầu ra:$24.00/M
GPT-4 Turbo is an artificial intelligence model provided by OpenAI.
O

gpt-4-search

Theo Yêu cầu:$0.04
O

gpt-4-gizmo-*

Đầu vào:$24.00/M
Đầu ra:$48.00/M
O

gpt-4-gizmo

Đầu vào:$24.00/M
Đầu ra:$48.00/M
O

gpt-4-dalle

Theo Yêu cầu:$0.04
O

gpt-4-all

Đầu vào:$24.00/M
Đầu ra:$48.00/M
A

gpt-4-32k

Đầu vào:$48.00/M
Đầu ra:$96.00/M
GPT-4 32K is an artificial intelligence model provided by Azure.
O

gpt-4-1106-preview

Đầu vào:$8.00/M
Đầu ra:$16.00/M
O

gpt-4-0613

Đầu vào:$24.00/M
Đầu ra:$48.00/M
O

gpt-4-0314

Đầu vào:$24.00/M
Đầu ra:$48.00/M
O

gpt-4-0125-preview

Đầu vào:$8.00/M
Đầu ra:$16.00/M
O

gpt-4

Đầu vào:$24.00/M
Đầu ra:$48.00/M
GPT-4 is an artificial intelligence model provided by OpenAI.
O

gpt-3.5-turbo-0125

Đầu vào:$0.40/M
Đầu ra:$1.20/M
GPT-3.5 Turbo 0125 is an artificial intelligence model provided by OpenAI. A pure official high-speed GPT-3.5 series, supporting tools_call. This model supports a maximum context length of 4096 tokens.
O

gpt-3.5-turbo

Đầu vào:$0.40/M
Đầu ra:$1.20/M
GPT-3.5 Turbo is an artificial intelligence model provided by OpenAI. A pure official high-speed GPT-3.5 series, supporting tools_call. This model supports a maximum context length of 4096 tokens.
O

dall-e-3

Theo Yêu cầu:$0.02
New version of DALL-E for image generation.
O

dall-e-2

Đầu vào:$8.00/M
Đầu ra:$32.00/M
An AI model that generates images from text descriptions.
C

Claude Sonnet 4.5

Bối cảnh:200K
Đầu vào:$2.40/M
Đầu ra:$12.00/M
Claude Sonnet 4.5 đạt bước nhảy vọt đáng kể về khả năng thực hiện tác vụ trên máy tính. Trên OSWorld, một nền tảng đánh giá chuẩn để kiểm thử các mô hình AI trên các tác vụ máy tính trong thế giới thực, Sonnet 4.5 đã vươn lên dẫn đầu với 61.4%, trong khi chỉ bốn tháng trước đó, Sonnet 4 dẫn đầu với 42.2%. Tiện ích Claude for Chrome của chúng tôi đưa các tính năng nâng cấp này vào thực tiễn.
A

Claude Opus 4.5

Bối cảnh:200K
Đầu vào:$4.00/M
Đầu ra:$20.00/M
Claude Opus 4.5 là một mô hình ngôn ngữ lớn được tinh chỉnh theo hướng dẫn từ Anthropic, được thiết kế cho lập luận phức tạp, lập trình và đối thoại nhiều lượt. Nó hỗ trợ xử lý ngữ cảnh mở rộng, gọi công cụ/hàm, đầu ra có cấu trúc và tích hợp với các quy trình làm việc tăng cường truy xuất. Các trường hợp sử dụng điển hình bao gồm trợ lý phân tích, tạo và rà soát mã, hỏi đáp trên cơ sở tri thức và soạn thảo nội dung với các phản hồi phù hợp với chính sách. Các điểm nổi bật về kỹ thuật bao gồm khả năng tuân thủ hướng dẫn, hành vi thân thiện với RAG và các cơ chế kiểm soát an toàn có sẵn trong các triển khai Claude.
C

Claude Opus 4.1

Bối cảnh:200K
Đầu vào:$12.00/M
Đầu ra:$60.00/M
Claude Opus 4.1 là phiên bản cập nhật của mô hình chủ lực Anthropic, mang lại hiệu năng cải thiện trong lập trình, suy luận và các tác vụ tác nhân. Mô hình đạt 74.5% trên SWE-bench Verified, cho thấy những cải thiện đáng kể về tái cấu trúc mã đa tệp, độ chính xác khi gỡ lỗi và suy luận chú trọng chi tiết. Mô hình này hỗ trợ khả năng suy luận mở rộng lên đến 64K token và được tối ưu cho các tác vụ liên quan đến nghiên cứu, phân tích dữ liệu và suy luận có hỗ trợ công cụ.
C

Claude 4 Sonnet

Bối cảnh:200K
Đầu vào:$2.40/M
Đầu ra:$12.00/M
Mô hình nhanh nhất, tiết kiệm chi phí nhất, cửa sổ ngữ cảnh 200K.
C

Claude Opus 4

Bối cảnh:200K
Đầu vào:$12.00/M
Đầu ra:$60.00/M
Sự cân bằng tối ưu giữa trí tuệ, chi phí và tốc độ. Cửa sổ ngữ cảnh 200K.
C

Claude 3.7 Sonnet

Đầu vào:$2.40/M
Đầu ra:$12.00/M
Nước đi lớn của Claude đối đầu R1, phiên bản 3.7 mạnh mẽ đã chính thức ra mắt. Mô hình này hỗ trợ độ dài ngữ cảnh tối đa là 200,000 token. Có hỗ trợ tư duy.
C

Claude Haiku 4.5

Bối cảnh:200K
Đầu vào:$0.80/M
Đầu ra:$4.00/M
Mô hình nhanh nhất, tiết kiệm chi phí nhất.
C

Claude 3.5 Haiku

Đầu vào:$0.80/M
Đầu ra:$4.00/M
Các bí danh này tự động trỏ tới bản snapshot mới nhất của một mô hình nhất định. Mặc dù hữu ích cho việc thử nghiệm, chúng tôi khuyến nghị sử dụng các phiên bản mô hình cụ thể (ví dụ: claude-3-5-sonnet-20241022) trong các ứng dụng sản xuất để đảm bảo hành vi nhất quán. Khi chúng tôi phát hành các bản snapshot mô hình mới, chúng tôi sẽ cập nhật bí danh -latest để trỏ tới phiên bản mới (thường trong vòng một tuần kể từ khi phiên bản mới được phát hành). Bí danh -latest có cùng giới hạn tần suất và mức giá như phiên bản mô hình cơ sở mà nó tham chiếu. Mô hình này hỗ trợ độ dài ngữ cảnh tối đa là 200,000 tokens.
C

Claude 3 Haiku

Đầu vào:$0.20/M
Đầu ra:$1.00/M
Claude Haiku 3 là một mô hình trí tuệ nhân tạo do Anthropic cung cấp.
G

Veo 3.1 Pro

Theo Yêu cầu:$2.00
Veo 3.1-Pro đề cập đến quyền truy cập/cấu hình có khả năng cao của dòng Veo 3.1 của Google — một thế hệ mô hình video dạng ngắn, có hỗ trợ âm thanh, bổ sung âm thanh gốc phong phú hơn, các điều khiển tường thuật/chỉnh sửa được cải thiện và các công cụ mở rộng cảnh.
G

Veo 3.1

Theo Yêu cầu:$0.40
Veo 3.1 là bản cập nhật tiệm tiến nhưng đáng kể của Google cho dòng Veo chuyển đổi văn bản và hình ảnh→video, bổ sung âm thanh gốc phong phú hơn, đầu ra video dài hơn và dễ kiểm soát hơn, cùng khả năng chỉnh sửa tinh vi và điều khiển ở cấp độ cảnh.
G

Veo 3 Pro

Theo Yêu cầu:$2.00
Veo 3 pro đại diện cho trải nghiệm mô hình video Veo 3 đạt chuẩn sản xuất (độ trung thực cao, âm thanh tích hợp sẵn và bộ công cụ mở rộng)
G

Veo 3 Fast

Theo Yêu cầu:$0.40
Veo 3 Fast là biến thể được Google tối ưu hóa cho tốc độ trong dòng mô hình video sinh Veo (Veo 3 / Veo 3.1, v.v.). Nó được thiết kế để tạo ra các đoạn video ngắn, chất lượng cao với âm thanh được tạo trực tiếp, đồng thời ưu tiên thông lượng và chi phí trên mỗi giây — đánh đổi một phần độ trung thực hình ảnh ở mức cao nhất và/hoặc thời lượng một cú máy dài hơn để có tốc độ tạo nhanh hơn nhiều và mức giá thấp hơn. Veo 3 Fast là gì — giới thiệu ngắn gọn
G

Veo 3

Theo Yêu cầu:$0.40
Veo 3 của Google DeepMind đại diện cho đỉnh cao của công nghệ tạo video từ văn bản, đánh dấu lần đầu tiên một mô hình AI tạo sinh quy mô lớn có thể đồng bộ hóa liền mạch video độ trung thực cao với âm thanh đi kèm — bao gồm lời thoại, hiệu ứng âm thanh và âm thanh môi trường.
G

Gemini 2.5 Pro

Bối cảnh:1M
Đầu vào:$1.00/M
Đầu ra:$8.00/M
Gemini 2.5 Pro là một mô hình trí tuệ nhân tạo do Google cung cấp. Nó có khả năng xử lý đa phương thức nguyên sinh và cửa sổ ngữ cảnh siêu dài lên tới 1 triệu token, mang lại sự hỗ trợ mạnh mẽ chưa từng có cho các tác vụ phức tạp có chuỗi dài. Theo dữ liệu của Google, Gemini 2.5 Pro thể hiện đặc biệt tốt trong các tác vụ phức tạp. Mô hình này hỗ trợ độ dài ngữ cảnh tối đa là 1,048,576 token.
G

Gemini 2.5 Flash

Bối cảnh:1M
Đầu vào:$0.24/M
Đầu ra:$2.00/M
Gemini 2.5 Flash là một mô hình AI do Google phát triển, được thiết kế để cung cấp các giải pháp nhanh và tiết kiệm chi phí cho nhà phát triển, đặc biệt cho các ứng dụng đòi hỏi khả năng suy luận nâng cao. Theo thông báo về bản xem trước của Gemini 2.5 Flash, mô hình này đã được phát hành dưới dạng bản xem trước vào ngày 17 tháng 4 năm 2025, hỗ trợ đầu vào đa phương thức và có cửa sổ ngữ cảnh 1 triệu token. Mô hình này hỗ trợ độ dài ngữ cảnh tối đa 65,536 token.
G

Nano Banana

Theo Yêu cầu:$0.03
Gemini 2.5 Flash Image (hay còn gọi là nano-banana), mô hình tạo sinh và chỉnh sửa hình ảnh tiên tiến nhất của Google. Bản cập nhật này cho phép bạn kết hợp nhiều hình ảnh thành một, duy trì tính nhất quán về nhân vật để kể những câu chuyện phong phú, thực hiện các biến đổi có mục tiêu bằng ngôn ngữ tự nhiên và tận dụng kiến thức thế giới của Gemini để tạo và chỉnh sửa hình ảnh.
G

Gemini 2.5 Flash Lite

Bối cảnh:1M
Đầu vào:$0.08/M
Đầu ra:$0.32/M
Một mô hình Gemini 2.5 Flash được tối ưu hóa nhằm đạt hiệu quả về chi phí cao và thông lượng cao. Mô hình nhỏ nhất, có hiệu quả về chi phí cao nhất, được xây dựng để sử dụng ở quy mô lớn.
G

Gemini 2.5 Pro DeepSearch

Đầu vào:$8.00/M
Đầu ra:$64.00/M
Mô hình tìm kiếm chuyên sâu, với khả năng tìm kiếm chuyên sâu và truy xuất thông tin được tăng cường, là lựa chọn lý tưởng cho việc tích hợp và phân tích tri thức phức tạp.
G

Gemini 2.5 Pro (All)

Đầu vào:$2.00/M
Đầu ra:$16.00/M
Gemini 2.5 Pro (All) là mô hình đa phương thức dành cho việc hiểu văn bản và phương tiện, được thiết kế cho các trợ lý mục đích chung và lập luận có căn cứ. Mô hình xử lý việc tuân thủ chỉ dẫn, viết phân tích, hiểu mã và hiểu hình ảnh/âm thanh, với khả năng gọi công cụ/hàm đáng tin cậy và hành vi thân thiện với RAG. Các trường hợp sử dụng điển hình bao gồm tác nhân chat doanh nghiệp, phân tích tài liệu và giao diện người dùng, hỏi đáp dựa trên hình ảnh và tự động hóa quy trình công việc. Những điểm nổi bật kỹ thuật bao gồm đầu vào hợp nhất hình ảnh‑văn bản‑âm thanh, hỗ trợ ngữ cảnh dài, đầu ra JSON có cấu trúc, phản hồi dạng luồng và kiểm soát chỉ dẫn hệ thống.
G

Gemini 2.5 Flash DeepSearch

Đầu vào:$4.80/M
Đầu ra:$38.40/M
Mô hình tìm kiếm chuyên sâu, với khả năng tìm kiếm chuyên sâu và truy xuất thông tin nâng cao, là lựa chọn lý tưởng cho việc tích hợp và phân tích kiến thức phức tạp.
G

Gemini 2.5 Flash (All)

Đầu vào:$0.24/M
Đầu ra:$2.00/M
Gemini 2.5 Flash là một mô hình AI do Google phát triển, được thiết kế để cung cấp các giải pháp nhanh và tiết kiệm chi phí cho các nhà phát triển, đặc biệt cho các ứng dụng yêu cầu khả năng suy luận nâng cao. Theo thông báo về bản xem trước của Gemini 2.5 Flash, mô hình đã được phát hành dưới dạng bản xem trước vào ngày 17 tháng 4 năm 2025, hỗ trợ đầu vào đa phương thức và có cửa sổ ngữ cảnh 1 triệu token. Mô hình này hỗ trợ độ dài ngữ cảnh tối đa 65,536 token.
G

Gemini 2.0 Flash Lite

Đầu vào:$0.08/M
Đầu ra:$0.32/M
Gemini 2.0 Flash Lite là một mô hình đa phương thức nhỏ gọn, được tinh chỉnh theo chỉ dẫn, tối ưu cho suy luận độ trễ thấp, thông lượng cao. Mô hình hỗ trợ hiểu văn bản và hình ảnh, tóm tắt, phân loại và lập luận nhẹ, kèm khả năng gọi công cụ/hàm và kiểm soát đầu ra có cấu trúc. Các trường hợp sử dụng điển hình bao gồm tác nhân hội thoại, soạn thảo nội dung nhanh, trích xuất siêu dữ liệu từ tài liệu hoặc ảnh chụp màn hình, và các quy trình làm việc được tăng cường bằng truy xuất. Các điểm nổi bật kỹ thuật bao gồm đầu vào văn bản và hình ảnh, sinh theo luồng, gọi công cụ/hàm, và các tùy chọn triển khai phù hợp với các dịch vụ nhạy cảm với độ trễ.
G

Gemini 2.0 Flash

Đầu vào:$0.08/M
Đầu ra:$0.32/M
Gemini 2.0 Flash là một mô hình trí tuệ nhân tạo do Google-Vertex cung cấp.
G

Nano Banana Pro

Theo Yêu cầu:$0.19
Nano Banana Pro là một mô hình AI dùng để hỗ trợ mục đích chung trong các quy trình công việc tập trung vào văn bản. Nó phù hợp với kiểu nhắc lệnh theo chỉ dẫn để tạo sinh, chuyển đổi và phân tích nội dung với cấu trúc có thể kiểm soát. Các trường hợp sử dụng điển hình bao gồm trợ lý trò chuyện, tóm tắt tài liệu, hỏi đáp kiến thức (QA) và tự động hóa quy trình làm việc. Chi tiết kỹ thuật công khai còn hạn chế; việc tích hợp phù hợp với các mẫu trợ lý AI phổ biến như đầu ra có cấu trúc, nhắc lệnh tăng cường truy xuất và gọi công cụ hoặc hàm.
G

Gemini 3 Pro Preview

Bối cảnh:200.0k
Đầu vào:$1.60/M
Đầu ra:$9.60/M
Gemini 3 Pro Preview là một mô hình mục đích chung trong họ Gemini, hiện có sẵn ở dạng bản xem trước để phục vụ đánh giá và tạo mẫu. Nó hỗ trợ tuân theo hướng dẫn, lập luận đa lượt và các tác vụ liên quan đến mã và dữ liệu, với đầu ra có cấu trúc và khả năng gọi công cụ/hàm để tự động hóa luồng công việc. Các trường hợp sử dụng điển hình bao gồm trợ lý trò chuyện, tóm tắt và viết lại, hỏi đáp tăng cường truy xuất, trích xuất dữ liệu và hỗ trợ viết mã nhẹ trên các ứng dụng và dịch vụ. Các điểm nổi bật về kỹ thuật bao gồm triển khai dựa trên API, phản hồi theo luồng, kiểm soát an toàn và khả năng sẵn sàng tích hợp, cùng khả năng đa phương thức tùy thuộc vào cấu hình bản xem trước.
X

Grok Code Fast 1

Bối cảnh:256K
Đầu vào:$0.16/M
Đầu ra:$1.20/M
Grok Code Fast 1 là một mô hình AI cho lập trình do xAI ra mắt, được thiết kế để thực hiện nhanh chóng và hiệu quả các tác vụ lập trình cơ bản. Mô hình có thể xử lý 92 token mỗi giây, có cửa sổ ngữ cảnh 256k, và phù hợp cho việc tạo mẫu nhanh, gỡ lỗi mã nguồn, cũng như tạo các phần tử trực quan đơn giản.
X

Grok 4 Fast

Bối cảnh:2M
Đầu vào:$0.16/M
Đầu ra:$0.40/M
Grok 4 Fast là một mô hình trí tuệ nhân tạo mới do xAI ra mắt, tích hợp các khả năng suy luận (Inference) và không suy luận (non-Inference) trong một kiến trúc duy nhất. Mô hình này có cửa sổ ngữ cảnh 2 triệu token và được thiết kế cho các ứng dụng thông lượng cao như tìm kiếm và lập trình. Mô hình cung cấp hai phiên bản: Grok-4-Fast-Reasoning và Grok-4-Fast-Non-Reasoning, được tối ưu cho các nhiệm vụ khác nhau.
X

Grok 4.1 Fast

Bối cảnh:2M
Đầu vào:$0.16/M
Đầu ra:$0.40/M
Grok 4.1 Fast là mô hình lớn định hướng sản xuất của xAI, được tối ưu cho gọi công cụ theo tác nhân, quy trình làm việc với ngữ cảnh dài và suy luận với độ trễ thấp. Đây là một họ mô hình đa phương thức gồm hai biến thể, được thiết kế để vận hành các tác nhân tự động có khả năng tìm kiếm, thực thi mã, gọi dịch vụ và suy luận trên các ngữ cảnh cực lớn (tối đa 2 triệu token).
X

Grok 4

Bối cảnh:256K
Đầu vào:$2.40/M
Đầu ra:$12.00/M
Grok 4 là một mô hình trí tuệ nhân tạo do XAI cung cấp. Hiện hỗ trợ phương thức văn bản, với khả năng thị giác, tạo ảnh và các tính năng khác sẽ sớm ra mắt. Sở hữu các tham số kỹ thuật và năng lực hệ sinh thái cực kỳ mạnh mẽ: Cửa sổ ngữ cảnh: Hỗ trợ xử lý ngữ cảnh lên đến 256,000 token, dẫn đầu các mô hình phổ biến.
X

Grok 3 Reasoner

Đầu vào:$2.40/M
Đầu ra:$12.00/M
Mô hình suy luận Grok-3, với chuỗi suy luận, là đối thủ của R1 từ phía Elon Musk. Mô hình này hỗ trợ độ dài ngữ cảnh tối đa 100,000 token.
X

Grok 3 Mini

Đầu vào:$0.24/M
Đầu ra:$0.40/M
Một mô hình nhẹ biết suy nghĩ trước khi phản hồi. Nhanh, thông minh và lý tưởng cho các tác vụ dựa trên logic không yêu cầu kiến thức chuyên môn sâu. Có thể truy cập các dấu vết suy nghĩ thô. Mô hình này hỗ trợ độ dài ngữ cảnh tối đa là 100,000 token.
X

Grok 3 DeepSearch

Đầu vào:$2.40/M
Đầu ra:$12.00/M
Mô hình tìm kiếm kết nối sâu Grok-3. Mô hình này hỗ trợ độ dài ngữ cảnh tối đa là 100,000 token.
X

Grok 3 DeeperSearch

Đầu vào:$2.40/M
Đầu ra:$12.00/M
Mô hình tìm kiếm kết nối sâu Grok-3, vượt trội so với grok-3-deepsearch. Mô hình này hỗ trợ độ dài ngữ cảnh tối đa 100,000 token.
X

Grok 3

Đầu vào:$2.40/M
Đầu ra:$12.00/M
Grok-3 là mô hình chatbot trí tuệ nhân tạo mới nhất do công ty xAI của Elon Musk phát hành vào ngày 17 tháng 2 năm 2025. Cụm huấn luyện của nó đã đạt tới quy mô 200,000 card, thể hiện xuất sắc ở các tác vụ như toán học, khoa học và lập trình, và được Musk ca ngợi là "AI thông minh nhất trên Trái Đất". Mô hình này hỗ trợ độ dài ngữ cảnh tối đa 100,000 token.
X

Grok 2

Đầu vào:$0.80/M
Đầu ra:$0.80/M
Grok 2 là một mô hình trí tuệ nhân tạo do XAI cung cấp.
D

DeepSeek-V3.2

Bối cảnh:128K
Đầu vào:$0.22/M
Đầu ra:$0.35/M
DeepSeek v3.2 là bản phát hành chính thức mới nhất trong dòng DeepSeek V3: một họ mô hình ngôn ngữ mở trọng số quy mô lớn, ưu tiên suy luận, được thiết kế để hiểu ngữ cảnh dài, hỗ trợ sử dụng agent/công cụ mạnh mẽ, suy luận nâng cao, lập trình và toán học.
D

DeepSeek-V3

Đầu vào:$0.22/M
Đầu ra:$0.88/M
Mô hình DeepSeek-V3 phổ biến và hiệu quả về chi phí nhất. Phiên bản 671B đầy đủ. Mô hình này hỗ trợ độ dài ngữ cảnh tối đa 64,000 token.
D

DeepSeek-V3.1

Đầu vào:$0.44/M
Đầu ra:$1.32/M
DeepSeek V3.1 là bản nâng cấp trong dòng V của DeepSeek: một mô hình ngôn ngữ lớn lai “tư duy / không tư duy” nhằm đạt trí tuệ tổng quát với thông lượng cao, chi phí thấp và sử dụng công cụ mang tính tác tử. Nó giữ khả năng tương thích với API kiểu OpenAI, bổ sung khả năng gọi công cụ thông minh hơn và—theo công ty—mang lại tốc độ sinh nhanh hơn và độ tin cậy của tác tử được cải thiện.
D

DeepSeek-R1T2-Chimera

Đầu vào:$0.24/M
Đầu ra:$0.24/M
Một mô hình sinh văn bản Mixture of Experts với 671B tham số, được hợp nhất từ R1-0528, R1 và V3-0324 của DeepSeek-AI, hỗ trợ ngữ cảnh lên tới 60k tokens.
D

DeepSeek-Reasoner

Đầu vào:$0.44/M
Đầu ra:$1.75/M
DeepSeek-Reasoner là dòng LLM và endpoint API ưu tiên lập luận của DeepSeek, được thiết kế để (1) cho phép bên gọi xem được lập luận theo chuỗi tư duy (CoT) nội bộ và (2) vận hành ở các chế độ “thinking” được tinh chỉnh cho lập kế hoạch nhiều bước, toán học, lập trình và sử dụng tác tử/công cụ.
D

DeepSeek-OCR

Theo Yêu cầu:$0.04
DeepSeek-OCR là một mô hình nhận dạng ký tự quang học dùng để trích xuất văn bản từ hình ảnh và tài liệu. Nó xử lý các trang được quét, ảnh chụp và ảnh chụp màn hình UI để tạo bản chép văn bản kèm các dấu hiệu bố cục như ngắt dòng. Các trường hợp sử dụng phổ biến bao gồm số hóa tài liệu, tiếp nhận hóa đơn và biên lai, lập chỉ mục tìm kiếm và kích hoạt các quy trình RPA. Những điểm nổi bật về kỹ thuật bao gồm xử lý chuyển đổi hình ảnh thành văn bản, hỗ trợ nội dung được quét và được chụp, và đầu ra văn bản có cấu trúc để phục vụ việc phân tích ở các bước tiếp theo.
D

DeepSeek-Chat

Bối cảnh:64K
Đầu vào:$0.22/M
Đầu ra:$0.88/M
Mô hình DeepSeek-V3 phổ biến nhất và hiệu quả về chi phí nhất. Phiên bản 671B đầy đủ. Mô hình này hỗ trợ độ dài ngữ cảnh tối đa là 64,000 token.
Q

Qwen Image

Theo Yêu cầu:$0.03
Qwen-Image is a revolutionary image generation foundational model released by Alibaba's Tongyi Qianwen team in 2025. With a parameter scale of 20 billion, it is based on the MMDiT (Multimodal Diffusion Transformer) architecture. The model has achieved significant breakthroughs in complex text rendering and precise image editing, demonstrating exceptional performance particularly in Chinese text rendering. Translated with DeepL.com (free version)
M

Kimi-K2

Đầu vào:$0.45/M
Đầu ra:$1.79/M
- **kimi-k2-250905**: Phiên bản 0905 thuộc dòng Kimi K2 của Moonshot AI, hỗ trợ ngữ cảnh siêu dài (tối đa 256k token, frontend và gọi Tool). - 🧠 Gọi Tool được tăng cường: độ chính xác 100%, tích hợp liền mạch, phù hợp cho các tác vụ phức tạp và tối ưu hóa tích hợp. - ⚡️ Hiệu suất cao hơn: TPS lên đến 60-100 (API tiêu chuẩn), lên đến 600-100 ở chế độ Turbo, mang lại phản hồi nhanh hơn và khả năng suy luận được cải thiện, mốc kiến thức đến giữa năm 2025.
Q

qwen3-max-preview

Đầu vào:$0.24/M
Đầu ra:$2.42/M
- **qwen3-max-preview**: Alibaba Tongyi Qianwen team's latest Qwen3-Max-Preview model, positioned as the series' performance peak. - 🧠 Powerful Multimodal and Inference: Supports ultra-long context (up to 128k tokens) and Multimodal input, excels at complex Inference, code generation, translation, and creative content. - ⚡️ Breakthrough Improvement: Significantly optimized across multiple technical indicators, faster response speed, knowledge cutoff up to 2025, suitable for enterprise-level high-precision AI applications.
Q

qwen3-coder-plus-2025-07-22

Đầu vào:$0.24/M
Đầu ra:$0.97/M
Qwen3 Coder Plus stable version, released on July 22, 2025, provides higher stability, suitable for production deployment.
Q

qwen3-coder-plus

Đầu vào:$0.24/M
Đầu ra:$0.97/M
Q

qwen3-coder-480b-a35b-instruct

Đầu vào:$0.24/M
Đầu ra:$0.97/M
Q

qwen3-coder

Đầu vào:$0.24/M
Đầu ra:$0.97/M
Q

qwen3-8b

Đầu vào:$0.04/M
Đầu ra:$0.16/M
Q

qwen3-32b

Đầu vào:$1.60/M
Đầu ra:$6.40/M
Q

qwen3-30b-a3b

Đầu vào:$0.12/M
Đầu ra:$0.48/M
Has 3 billion parameters, balancing performance and resource requirements, suitable for enterprise-level applications. - This model may employ MoE or other optimized architectures, suitable for scenarios requiring efficient processing of complex tasks, such as intelligent customer service and content generation.
Q

qwen3-235b-a22b

Đầu vào:$0.22/M
Đầu ra:$2.22/M
Qwen3-235B-A22B is the flagship model of the Qwen3 series, with 23.5 billion parameters, using a Mixture of Experts (MoE) architecture. - Particularly suitable for complex tasks requiring high-performance Inference, such as coding, mathematics, and Multimodal applications.
Q

qwen3-14b

Đầu vào:$0.80/M
Đầu ra:$3.20/M
Q

qwen2.5-vl-72b-instruct

Đầu vào:$2.40/M
Đầu ra:$7.20/M
Q

qwen2.5-vl-72b

Đầu vào:$2.40/M
Đầu ra:$7.20/M
Q

qwen2.5-vl-32b-instruct

Đầu vào:$2.40/M
Đầu ra:$7.20/M
Q

qwen2.5-omni-7b

Đầu vào:$60.00/M
Đầu ra:$60.00/M
Q

qwen2.5-math-72b-instruct

Đầu vào:$3.20/M
Đầu ra:$3.20/M
Q

qwen2.5-coder-7b-instruct

Đầu vào:$0.80/M
Đầu ra:$0.80/M
Q

qwen2.5-coder-32b-instruct

Đầu vào:$0.80/M
Đầu ra:$0.80/M
Q

qwen2.5-7b-instruct

Đầu vào:$0.80/M
Đầu ra:$0.80/M
Q

qwen2.5-72b-instruct

Đầu vào:$3.20/M
Đầu ra:$3.20/M
Q

qwen2.5-32b-instruct

Đầu vào:$0.96/M
Đầu ra:$0.96/M
Q

qwen2.5-14b-instruct

Đầu vào:$3.20/M
Đầu ra:$3.20/M
Q

qwen2-vl-7b-instruct

Đầu vào:$1.60/M
Đầu ra:$1.60/M
Q

qwen2-vl-72b-instruct

Đầu vào:$1.60/M
Đầu ra:$1.60/M
Q

qwen2-7b-instruct

Đầu vào:$0.16/M
Đầu ra:$0.16/M
Q

qwen2-72b-instruct

Đầu vào:$8.00/M
Đầu ra:$8.00/M
Q

qwen2-57b-a14b-instruct

Đầu vào:$3.20/M
Đầu ra:$3.20/M
Q

qwen2-1.5b-instruct

Đầu vào:$0.16/M
Đầu ra:$0.16/M
Q

qwen1.5-7b-chat

Đầu vào:$0.16/M
Đầu ra:$0.16/M
Q

Qwen2.5-72B-Instruct-128K

Đầu vào:$3.20/M
Đầu ra:$3.20/M
M

mj_turbo_zoom

Theo Yêu cầu:$0.17
M

mj_turbo_variation

Theo Yêu cầu:$0.17
M

mj_turbo_upscale_subtle

Theo Yêu cầu:$0.17
M

mj_turbo_upscale_creative

Theo Yêu cầu:$0.17
M

mj_turbo_upscale

Theo Yêu cầu:$0.02
M

mj_turbo_upload

Theo Yêu cầu:$0.01
M

mj_turbo_shorten

Theo Yêu cầu:$0.17
M

mj_turbo_reroll

Theo Yêu cầu:$0.17
M

mj_turbo_prompt_analyzer_extended

Theo Yêu cầu:$0.00
M

mj_turbo_prompt_analyzer

Theo Yêu cầu:$0.00
M

mj_turbo_pic_reader

Theo Yêu cầu:$0.00
M

mj_turbo_pan

Theo Yêu cầu:$0.17
M

mj_turbo_modal

Theo Yêu cầu:$0.17
Submit the content in the modal popup, used for partial redrawing and Zoom functionality.
M

mj_turbo_low_variation

Theo Yêu cầu:$0.17
M

mj_turbo_inpaint

Theo Yêu cầu:$0.08
M

mj_turbo_imagine

Theo Yêu cầu:$0.17
M

mj_turbo_high_variation

Theo Yêu cầu:$0.17
M

mj_turbo_describe

Theo Yêu cầu:$0.00
M

mj_turbo_custom_zoom

Theo Yêu cầu:$0.00
M

mj_turbo_blend

Theo Yêu cầu:$0.17
M

mj_fast_zoom

Theo Yêu cầu:$0.06
M

mj_fast_video

Theo Yêu cầu:$0.60
Midjourney video generation
M

mj_fast_variation

Theo Yêu cầu:$0.06
M

mj_fast_upscale_subtle

Theo Yêu cầu:$0.06
M

mj_fast_upscale_creative

Theo Yêu cầu:$0.06
M

mj_fast_upscale

Theo Yêu cầu:$0.01
M

mj_fast_upload

Theo Yêu cầu:$0.01
M

mj_fast_shorten

Theo Yêu cầu:$0.06
M

mj_fast_reroll

Theo Yêu cầu:$0.06
M

mj_fast_prompt_analyzer_extended

Theo Yêu cầu:$0.00
M

mj_fast_prompt_analyzer

Theo Yêu cầu:$0.00
M

mj_fast_pic_reader

Theo Yêu cầu:$0.00
M

mj_fast_pan

Theo Yêu cầu:$0.06
M

mj_fast_modal

Theo Yêu cầu:$0.06
M

mj_fast_low_variation

Theo Yêu cầu:$0.06
M

mj_fast_inpaint

Theo Yêu cầu:$0.06
M

mj_fast_imagine

Theo Yêu cầu:$0.06
Midjourney drawing
M

mj_fast_high_variation

Theo Yêu cầu:$0.06
M

mj_fast_edits

Theo Yêu cầu:$0.06
M

mj_fast_describe

Theo Yêu cầu:$0.00
M

mj_fast_custom_zoom

Theo Yêu cầu:$0.00
M

mj_fast_blend

Theo Yêu cầu:$0.06
S

suno_uploads

Theo Yêu cầu:$0.02
Tải lên nhạc
S

suno_persona_create

Theo Yêu cầu:$0.01
Create a personal style
S

suno_music

Theo Yêu cầu:$0.14
Tạo nhạc
S

suno_lyrics

Theo Yêu cầu:$0.02
Generate lyrics
S

suno_concat

Theo Yêu cầu:$0.04
Song splicing
S

suno_act_wav

Theo Yêu cầu:$0.01
Get WAV format files
S

suno_act_timing

Theo Yêu cầu:$0.01
Timing: Lyrics, Audio timeline
S

suno_act_stems

Theo Yêu cầu:$0.01
S

suno_act_mp4

Theo Yêu cầu:$0.01
Generate MP4 MV
K

kling_virtual_try_on

Theo Yêu cầu:$0.20
K

kling_video

Theo Yêu cầu:$0.40
K

kling_tts

Theo Yêu cầu:$0.02
[Tổng hợp giọng nói] Mới ra mắt: chuyển văn bản thành âm thanh phát sóng trực tuyến, có chức năng xem trước ● Có thể đồng thời tạo audio_id, dùng được với bất kỳ Keling API nào.
K

kling_multi_image2image

Theo Yêu cầu:$0.32
K

kling_multi_elements_submit

Theo Yêu cầu:$0.40
K

kling_multi_elements_preview

Theo Yêu cầu:$0.00
K

kling_multi_elements_init

Theo Yêu cầu:$0.00
K

kling_multi_elements_delete

Theo Yêu cầu:$0.00
K

kling_multi_elements_clear

Theo Yêu cầu:$0.00
K

kling_multi_elements_add

Theo Yêu cầu:$0.00
K

kling_lip_sync

Theo Yêu cầu:$0.20
K

kling_image_recognize

Theo Yêu cầu:$0.04
API nhận dạng các thành phần hình ảnh Keling, có thể dùng để tạo video tham chiếu từ nhiều hình ảnh, các tính năng chỉnh sửa video đa mô thức ● Có thể nhận dạng chủ thể, khuôn mặt, trang phục, v.v., và có thể nhận được 4 bộ kết quả (nếu có) cho mỗi yêu cầu.
K

kling_image_expand

Theo Yêu cầu:$0.16
K

kling_image

Theo Yêu cầu:$0.02
K

kling_identify_face

Theo Yêu cầu:$0.02
K

kling_extend

Theo Yêu cầu:$0.40
K

kling_effects

Theo Yêu cầu:$0.40
K

kling_avatar_image2video

Theo Yêu cầu:$0.16
K

kling_audio_video_to_audio

Theo Yêu cầu:$0.20
K

kling_audio_text_to_audio

Theo Yêu cầu:$0.20
K

kling_advanced_lip_syn

Theo Yêu cầu:$0.20
D

Doubao Seedream 4-5

Theo Yêu cầu:$0.04
Seedream 4.5 là mô hình hình ảnh đa phương thức (văn bản→hình ảnh + chỉnh sửa hình ảnh) của ByteDance/Seed, tập trung vào độ trung thực hình ảnh ở cấp độ sản xuất, bám sát prompt tốt hơn và tính nhất quán khi chỉnh sửa được cải thiện đáng kể (bảo toàn chủ thể, kết xuất văn bản/typography và độ chân thực khuôn mặt).
D

doubao-seedream-4-0-250828

Theo Yêu cầu:$0.02
D

doubao-seedream-3-0-t2i-250415

Theo Yêu cầu:$0.02
D

doubao-seededit-3-0-i2i-250628

Theo Yêu cầu:$0.02
D

doubao-seed-1-6-thinking-250715

Đầu vào:$0.04/M
Đầu ra:$1.07/M
D

doubao-seed-1-6-flash-250615

Đầu vào:$0.04/M
Đầu ra:$1.07/M
D

doubao-seed-1-6-250615

Đầu vào:$0.04/M
Đầu ra:$1.07/M
D

doubao-1.5-vision-pro-250328

Đầu vào:$0.33/M
Đầu ra:$1.00/M
D

doubao-1.5-vision-lite-250315

Đầu vào:$0.17/M
Đầu ra:$0.50/M
D

doubao-1.5-pro-32k-250115

Đầu vào:$0.18/M
Đầu ra:$0.44/M
D

doubao-1.5-pro-256k

Đầu vào:$1.10/M
Đầu ra:$1.99/M
D

doubao-1-5-vision-pro-32k

Đầu vào:$0.33/M
Đầu ra:$1.00/M
D

doubao-1-5-thinking-vision-pro-250428

Đầu vào:$0.33/M
Đầu ra:$1.00/M
D

doubao-1-5-thinking-pro-250415

Đầu vào:$0.45/M
Đầu ra:$1.79/M
D

doubao-1-5-pro-32k-250115

Đầu vào:$0.18/M
Đầu ra:$0.44/M
D

doubao-1-5-pro-32k

Đầu vào:$0.18/M
Đầu ra:$0.44/M
D

doubao-1-5-pro-256k-250115

Đầu vào:$0.56/M
Đầu ra:$1.00/M
D

doubao-1-5-pro-256k

Đầu vào:$1.10/M
Đầu ra:$1.99/M
D

doubao-1-5-lite-32k-250115

Đầu vào:$0.03/M
Đầu ra:$0.07/M
D

Doubao-Seed-1.6-thinking

Đầu vào:$0.04/M
Đầu ra:$1.07/M
D

Doubao-Seed-1.6-flash

Đầu vào:$0.04/M
Đầu ra:$1.07/M
D

Doubao-Seed-1.6

Đầu vào:$0.04/M
Đầu ra:$1.07/M
D

Doubao-1.5-vision-pro-32k

Đầu vào:$0.33/M
Đầu ra:$1.00/M
D

Doubao-1.5-vision-pro

Đầu vào:$0.33/M
Đầu ra:$1.00/M
D

Doubao-1.5-vision-lite

Đầu vào:$0.17/M
Đầu ra:$0.50/M
D

Doubao-1.5-thinking-vision-pro

Đầu vào:$0.33/M
Đầu ra:$1.00/M
D

Doubao-1.5-thinking-pro

Đầu vào:$0.45/M
Đầu ra:$1.79/M
D

Doubao-1.5-pro-32k

Đầu vào:$0.18/M
Đầu ra:$0.44/M
D

Doubao-1.5-lite-32k

Đầu vào:$0.07/M
Đầu ra:$0.13/M
R

runwayml_video_to_video

Theo Yêu cầu:$0.96
R

runwayml_upscale_video

Theo Yêu cầu:$0.16
R

runwayml_text_to_image

Theo Yêu cầu:$0.32
R

runwayml_image_to_video

Theo Yêu cầu:$0.32
R

runwayml_character_performance

Theo Yêu cầu:$0.40
R

runway_video2video

Theo Yêu cầu:$0.20
R

runway_video

Theo Yêu cầu:$0.20
R

runway_act_one

Theo Yêu cầu:$0.40
R

Black Forest Labs/FLUX 2 PRO

Theo Yêu cầu:$0.06
FLUX 2 PRO là mẫu thương mại đầu bảng trong dòng FLUX 2, mang lại khả năng tạo sinh hình ảnh tối tân với chất lượng và độ chi tiết chưa từng có. Được xây dựng cho các ứng dụng chuyên nghiệp và doanh nghiệp, mẫu này cung cấp khả năng bám sát prompt vượt trội, hình ảnh chân thực như thật và khả năng nghệ thuật xuất sắc. Mẫu này đại diện cho trình độ tiên tiến nhất của công nghệ tổng hợp hình ảnh bằng AI.
R

Black Forest Labs/FLUX 2 FLEX

Theo Yêu cầu:$0.19
FLUX 2 FLEX is the versatile, adaptable model designed for flexible deployment across various use cases and hardware configurations. It offers scalable performance with adjustable quality settings, making it ideal for applications requiring dynamic resource allocation. This model provides the best balance between quality, speed, and resource efficiency.
R

Black Forest Labs/FLUX 2 DEV

Theo Yêu cầu:$0.06
FLUX 2 DEV is the development-friendly version optimized for research, experimentation, and non-commercial applications. It provides developers with powerful image generation capabilities while maintaining a balance between quality and computational efficiency. Perfect for prototyping, academic research, and personal creative projects.
R

stability-ai/stable-diffusion-3.5-medium

Theo Yêu cầu:$0.11
R

stability-ai/stable-diffusion-3.5-large-turbo

Theo Yêu cầu:$0.13
R

stability-ai/stable-diffusion-3.5-large

Theo Yêu cầu:$0.21
R

stability-ai/stable-diffusion-3

Theo Yêu cầu:$0.11
R

stability-ai/stable-diffusion

Theo Yêu cầu:$0.02
R

stability-ai/sdxl

Theo Yêu cầu:$0.03
R

recraft-ai/recraft-v3-svg

Theo Yêu cầu:$0.26
R

recraft-ai/recraft-v3

Theo Yêu cầu:$0.13
R

ideogram-ai/ideogram-v2-turbo

Theo Yêu cầu:$0.06
R

ideogram-ai/ideogram-v2

Theo Yêu cầu:$0.10
R

bria/remove-background

Đầu vào:$60.00/M
Đầu ra:$60.00/M
R

bria/increase-resolution

Đầu vào:$60.00/M
Đầu ra:$60.00/M
R

bria/image-3.2

Đầu vào:$60.00/M
Đầu ra:$60.00/M
R

bria/genfill

Đầu vào:$60.00/M
Đầu ra:$60.00/M
R

bria/generate-background

Đầu vào:$60.00/M
Đầu ra:$60.00/M
R

bria/expand-image

Đầu vào:$60.00/M
Đầu ra:$60.00/M
R

bria/eraser

Đầu vào:$60.00/M
Đầu ra:$60.00/M
R

black-forest-labs/flux-schnell

Theo Yêu cầu:$0.01
black-forest-labs/flux-schnell là một mô hình sinh ảnh từ văn bản (text-to-image) của Black Forest Labs, được thiết kế cho việc lấy mẫu nhanh và khám phá prompt theo vòng lặp. Mô hình có thể tổng hợp đa dạng phong cách và bố cục từ các prompt ngắn, hỗ trợ prompt phủ định và kiểm soát seed, đồng thời tạo ra đầu ra độ phân giải cao phù hợp cho mockup sản phẩm, concept art và hình ảnh marketing. Các trường hợp sử dụng điển hình gồm lên ý tưởng tương tác, tạo thumbnail và banner, và tạo các biến thể sáng tạo tự động trong quy trình nội dung. Những điểm nổi bật về kỹ thuật bao gồm khả năng tương thích với ngăn xếp Hugging Face Diffusers, điều khiển độ phân giải linh hoạt, và bộ lấy mẫu hiệu quả được tinh chỉnh cho tốc độ trên các GPU phổ biến.
R

black-forest-labs/flux-pro

Theo Yêu cầu:$0.18
black-forest-labs/flux-pro là mô hình tạo sinh text-to-image từ Black Forest Labs dùng để tổng hợp hình ảnh độ trung thực cao trên nhiều phong cách và chủ đề. Nó biến các prompt chi tiết thành những bố cục mạch lạc với các thuộc tính có thể điều khiển như tỷ lệ khung hình và phong cách thông qua các tham số tạo tiêu chuẩn. Các trường hợp sử dụng điển hình bao gồm concept art, trực quan hóa sản phẩm, nội dung sáng tạo tiếp thị và các cảnh chân thực như ảnh trong quy trình thiết kế. Những điểm nổi bật về kỹ thuật bao gồm mô thức text-to-image, khả năng làm theo prompt giống như hướng dẫn và tích hợp vào các chuỗi công cụ tạo ảnh phổ biến.
R

black-forest-labs/flux-kontext-pro

Theo Yêu cầu:$0.05
black-forest-labs/flux-kontext-pro là một mô hình khuếch tán đa phương thức dùng cho tạo ảnh nhận biết bối cảnh. Mô hình tổng hợp ảnh từ lời nhắc văn bản và ảnh tham chiếu tùy chọn, đồng thời duy trì các gợi ý về bố cục và phong cách để cho ra kết quả bám sát ngữ cảnh. Các trường hợp sử dụng điển hình bao gồm tạo tài sản thương hiệu, hình ảnh sản phẩm, và lên ý tưởng hình ảnh bằng mood board hoặc ảnh mẫu. Các điểm nổi bật kỹ thuật bao gồm đầu vào văn bản và hình ảnh, lấy mẫu có điều kiện dựa trên tham chiếu, và đầu ra có thể tái lập thông qua kiểm soát seed.
R

black-forest-labs/flux-kontext-max

Theo Yêu cầu:$0.10
black-forest-labs/flux-kontext-max là một mô hình tạo ảnh được điều kiện hóa theo ngữ cảnh thuộc dòng FLUX, được xây dựng để tạo ảnh từ văn bản với các đầu vào tham chiếu tùy chọn. Nó cho phép tổng hợp bám sát ngữ cảnh, bảo toàn phong cách hoặc chủ thể, và tạo các biến thể có kiểm soát được dẫn dắt bởi ngữ cảnh thị giác được cung cấp. Các ứng dụng điển hình bao gồm nội dung sáng tạo nhất quán với thương hiệu, mockup sản phẩm, tính nhất quán nhân vật, và lên ý tưởng dựa trên moodboard. Các điểm nổi bật kỹ thuật bao gồm tạo sinh dựa trên khuếch tán và điều kiện hóa đa phương thức với văn bản và đầu vào tham chiếu, phù hợp với các quy trình làm việc được dẫn dắt bởi tham chiếu.
R

black-forest-labs/flux-dev

Theo Yêu cầu:$0.08
black-forest-labs/flux-dev là một mô hình chuyển văn bản thành hình ảnh với trọng số mở từ Black Forest Labs, dùng để tạo ảnh từ các prompt bằng ngôn ngữ tự nhiên. Mô hình tạo ra kết quả chân thực như ảnh và được phong cách hóa từ các prompt chi tiết, và tương thích với các tùy chọn điều khiển phổ biến trong chuỗi công cụ diffusion. Các trường hợp sử dụng điển hình bao gồm minh họa ý tưởng, trực quan hóa sản phẩm, hình ảnh tiếp thị và khám phá sáng tạo nhanh trong quy trình thiết kế. Những điểm nổi bật kỹ thuật gồm thiết kế rectified-flow dựa trên transformer, tích hợp với thư viện Hugging Face Diffusers, và triển khai qua các ngăn xếp suy luận GPU tiêu chuẩn.
R

black-forest-labs/flux-1.1-pro-ultra

Theo Yêu cầu:$0.19
black-forest-labs/flux-1.1-pro-ultra là một mô hình Transformer khuếch tán text-to-image được thiết kế cho việc tổng hợp hình ảnh ở môi trường sản xuất từ các lời nhắc ngôn ngữ tự nhiên. Nó tạo ra đầu ra chi tiết từ các hướng dẫn phức tạp, đồng thời cung cấp điều khiển về phong cách, bố cục, tỷ lệ khung hình, negative prompts và khả năng tái lập theo seed. Các trường hợp sử dụng điển hình bao gồm sáng tạo tiếp thị, trực quan hóa sản phẩm, concept art và lên ý tưởng nội dung. Các điểm nổi bật về kỹ thuật bao gồm khuếch tán dựa trên Transformer, hướng dẫn bởi bộ mã hóa văn bản và khả năng triển khai qua các API suy luận phổ biến với các tham số scheduler và guidance.
R

black-forest-labs/flux-1.1-pro

Theo Yêu cầu:$0.13
black-forest-labs/flux-1.1-pro là mô hình sinh ảnh từ văn bản của Black Forest Labs dành cho hình ảnh có khả năng kiểm soát và độ trung thực cao. Mô hình diễn giải các prompt chi tiết để tạo ra hình ảnh đa dạng về phong cách và chủ đề, đồng thời hỗ trợ tinh chỉnh lặp và tạo biến thể hình ảnh trong các quy trình diffusion phổ biến. Các trường hợp sử dụng điển hình bao gồm concept art, mockup sản phẩm, hình ảnh marketing và khám phá cảnh. Những điểm nổi bật về kỹ thuật bao gồm tổng hợp hình ảnh có điều kiện theo văn bản và tích hợp với các chuỗi công cụ suy luận tiêu chuẩn dùng cho các mô hình diffusion.
F

FLUX 2 PRO

Theo Yêu cầu:$0.08
FLUX 2 PRO is the flagship commercial model in the FLUX 2 series, delivering state-of-the-art image generation with unprecedented quality and detail. Built for professional and enterprise applications, it offers superior prompt adherence, photorealistic outputs, and exceptional artistic capabilities. This model represents the cutting edge of AI image synthesis technology.
F

FLUX 2 FLEX

Theo Yêu cầu:$0.01
FLUX 2 FLEX is the versatile, adaptable model designed for flexible deployment across various use cases and hardware configurations. It offers scalable performance with adjustable quality settings, making it ideal for applications requiring dynamic resource allocation. This model provides the best balance between quality, speed, and resource efficiency.
L

Llama-4-Scout

Đầu vào:$0.22/M
Đầu ra:$1.15/M
Llama-4-Scout là một mô hình ngôn ngữ đa năng dành cho tương tác kiểu trợ lý và tự động hóa. Nó xử lý việc tuân thủ chỉ dẫn, lập luận, tóm tắt và các tác vụ chuyển đổi, và có thể hỗ trợ ở mức nhẹ cho các tác vụ liên quan đến mã. Các trường hợp sử dụng điển hình bao gồm điều phối hội thoại, hỏi đáp tăng cường tri thức, và tạo nội dung có cấu trúc. Các điểm nổi bật kỹ thuật bao gồm khả năng tương thích với các mẫu gọi công cụ/hàm, nhắc lệnh tăng cường truy xuất, và đầu ra bị ràng buộc bởi lược đồ để tích hợp vào quy trình làm việc của sản phẩm.
L

Llama-4-Maverick

Đầu vào:$0.48/M
Đầu ra:$1.44/M
Llama-4-Maverick là một mô hình ngôn ngữ đa dụng dành cho việc hiểu và tạo sinh văn bản. Nó hỗ trợ Hỏi-Đáp hội thoại, tóm tắt, soạn thảo có cấu trúc và hỗ trợ viết mã cơ bản, với các tùy chọn cho đầu ra có cấu trúc. Các ứng dụng thường gặp bao gồm trợ lý sản phẩm, giao diện truy xuất tri thức và tự động hóa quy trình làm việc đòi hỏi định dạng nhất quán. Các chi tiết kỹ thuật như số tham số, cửa sổ ngữ cảnh, phương thức (modality), và khả năng gọi công cụ hoặc hàm có thể khác nhau tùy theo bản phân phối; hãy tích hợp theo các khả năng đã được tài liệu hóa của bản triển khai.
M

minimax_video-01

Theo Yêu cầu:$1.44
M

minimax_minimax-hailuo-02

Theo Yêu cầu:$2.88
M

minimax_files_retrieve

Theo Yêu cầu:$0.00
M

minimax-m2

Đầu vào:$0.24/M
Đầu ra:$0.96/M
minimax-m2 là một mô hình ngôn ngữ lớn gọn nhẹ và hiệu quả, được tối ưu cho lập trình end-to-end và quy trình làm việc của agent, với 10 tỷ tham số đang hoạt động (230 tỷ tham số tổng cộng), đạt hiệu năng tiệm cận mức tiên tiến nhất trong suy luận tổng quát, sử dụng công cụ và thực thi nhiệm vụ nhiều bước, đồng thời duy trì độ trễ thấp và hiệu quả triển khai cao. Mô hình xuất sắc trong sinh mã, chỉnh sửa đa tệp, các vòng lặp biên dịch-chạy-sửa và sửa lỗi trong xác minh kiểm thử, đạt kết quả xuất sắc trên các benchmark như SWE-Bench Verified, Multi-SWE-Bench và Terminal-Bench, và cho thấy tính cạnh tranh trong lập kế hoạch nhiệm vụ chu kỳ dài, truy xuất thông tin và khắc phục lỗi khi thực thi trong các đánh giá agent như BrowseComp và GAIA. Theo đánh giá của Artificial Analysis, MiniMax-M2 xếp trong nhóm hàng đầu của các mô hình mã nguồn mở về trí tuệ tổng hợp ở các lĩnh vực như toán học, suy luận khoa học và tuân thủ chỉ dẫn. Số lượng tham số đang hoạt động nhỏ cho phép suy luận nhanh, mức độ đồng thời cao và hiệu quả kinh tế đơn vị tốt hơn, khiến nó lý tưởng cho triển khai agent quy mô lớn, các công cụ hỗ trợ nhà phát triển và các ứng dụng dựa trên suy luận đòi hỏi tốc độ phản hồi và hiệu quả chi phí.
F

flux-pro-finetuned

Theo Yêu cầu:$0.07
F

flux-pro-1.1-ultra-finetuned

Theo Yêu cầu:$0.10
F

flux-pro-1.1-ultra

Theo Yêu cầu:$0.07
F

flux-pro-1.1

Theo Yêu cầu:$0.05
F

flux-pro-1.0-fill-finetuned

Theo Yêu cầu:$0.10
F

flux-pro-1.0-fill

Theo Yêu cầu:$0.06
F

flux-pro-1.0-depth-finetuned

Theo Yêu cầu:$0.10
F

flux-pro-1.0-depth

Theo Yêu cầu:$0.06
F

flux-pro-1.0-canny-finetuned

Theo Yêu cầu:$0.10
F

flux-pro-1.0-canny

Theo Yêu cầu:$0.06
F

flux-pro

Theo Yêu cầu:$0.05
F

flux-kontext-pro

Theo Yêu cầu:$0.05
F

flux-kontext-max

Theo Yêu cầu:$0.10
F

flux-finetune

Theo Yêu cầu:$0.05
F

flux-dev

Theo Yêu cầu:$0.03
H

hunyuan-vision

Đầu vào:$2.01/M
Đầu ra:$2.01/M
H

hunyuan-turbos-vision-20250619

Đầu vào:$0.33/M
Đầu ra:$1.00/M
H

hunyuan-turbos-vision

Đầu vào:$0.33/M
Đầu ra:$1.00/M
H

hunyuan-turbos-longtext-128k-20250325

Đầu vào:$0.17/M
Đầu ra:$0.67/M
H

hunyuan-turbos-latest

Đầu vào:$0.09/M
Đầu ra:$0.22/M
H

hunyuan-turbos-20250604

Đầu vào:$0.09/M
Đầu ra:$0.22/M
H

hunyuan-turbos-20250515

Đầu vào:$0.09/M
Đầu ra:$0.22/M
H

hunyuan-turbos-20250416

Đầu vào:$0.09/M
Đầu ra:$0.22/M
H

hunyuan-turbos-20250313

Đầu vào:$0.09/M
Đầu ra:$0.22/M
H

hunyuan-t1-vision-20250619

Đầu vào:$0.11/M
Đầu ra:$0.45/M
H

hunyuan-t1-vision

Đầu vào:$0.11/M
Đầu ra:$0.45/M
H

hunyuan-t1-latest

Đầu vào:$0.11/M
Đầu ra:$0.45/M
H

hunyuan-t1-20250711

Đầu vào:$0.11/M
Đầu ra:$0.45/M
H

hunyuan-t1-20250529

Đầu vào:$0.11/M
Đầu ra:$0.45/M
H

hunyuan-t1-20250521

Đầu vào:$0.11/M
Đầu ra:$0.45/M
H

hunyuan-t1-20250403

Đầu vào:$0.11/M
Đầu ra:$0.45/M
H

hunyuan-t1-20250321

Đầu vào:$0.11/M
Đầu ra:$0.45/M
H

hunyuan-standard-256K

Đầu vào:$0.06/M
Đầu ra:$0.22/M
H

hunyuan-standard

Đầu vào:$0.09/M
Đầu ra:$0.22/M
H

hunyuan-role

Đầu vào:$0.45/M
Đầu ra:$0.89/M
H

hunyuan-pro

Đầu vào:$1.60/M
Đầu ra:$1.60/M
H

hunyuan-lite

Đầu vào:$1.60/M
Đầu ra:$1.60/M
H

hunyuan-large-vision

Đầu vào:$0.45/M
Đầu ra:$1.34/M
H

hunyuan-large

Đầu vào:$0.45/M
Đầu ra:$1.34/M
H

hunyuan-functioncall

Đầu vào:$0.45/M
Đầu ra:$0.89/M
H

hunyuan-embedding

Đầu vào:$0.08/M
Đầu ra:$0.08/M
H

hunyuan-code

Đầu vào:$0.39/M
Đầu ra:$0.78/M
H

hunyuan-all

Đầu vào:$0.11/M
Đầu ra:$0.22/M
H

hunyuan-a13b

Đầu vào:$0.06/M
Đầu ra:$0.22/M
H

hunyuan

Đầu vào:$0.11/M
Đầu ra:$0.11/M
Z

glm-zero-preview

Đầu vào:$60.00/M
Đầu ra:$60.00/M
Z

glm-4v-plus

Đầu vào:$4.80/M
Đầu ra:$4.80/M
Z

glm-4v

Đầu vào:$24.00/M
Đầu ra:$24.00/M
Z

GLM 4.6

Bối cảnh:200
Đầu vào:$0.64/M
Đầu ra:$2.56/M
Mẫu flagship mới nhất GLM-4.6 của Zhipu đã ra mắt: tổng số tham số 355B, tham số kích hoạt 32B. Năng lực cốt lõi tổng thể vượt qua GLM-4.5. Lập trình: Ngang hàng với Claude Sonnet 4, tốt nhất tại Trung Quốc. Ngữ cảnh: Mở rộng lên 200K (ban đầu 128K). Suy luận: Được cải thiện, hỗ trợ gọi công cụ. Tìm kiếm: Tối ưu hóa khung công cụ và tác tử. Viết: Phù hợp hơn với sở thích của con người, phong cách viết và nhập vai. Đa ngôn ngữ: Nâng cao hiệu quả dịch thuật.
Z

glm-4.5-x

Đầu vào:$3.20/M
Đầu ra:$12.80/M
High-performance, strong Inference, extremely fast response model, optimized for scenarios requiring ultra-fast Inference speed and powerful logical capabilities, providing millisecond-level response experience.
Z

glm-4.5-flash

Đầu vào:$0.16/M
Đầu ra:$0.64/M
GLM-4.5-Flash is an artificial intelligence model provided by ZhipuAI.
Z

glm-4.5-airx

Đầu vào:$1.60/M
Đầu ra:$6.40/M
Lightweight, high-performance, ultra-fast response model, perfectly combining the cost advantages of Air and the speed advantages of X, an ideal choice for balancing performance and efficiency.
Z

glm-4.5-air

Đầu vào:$0.16/M
Đầu ra:$1.07/M
GLM-4.5-Air is an artificial intelligence model provided by ZhipuAI.
Z

glm-4.5

Đầu vào:$0.48/M
Đầu ra:$1.92/M
GLM-4.5 is an artificial intelligence model provided by ZhipuAI.
Z

glm-4-plus

Đầu vào:$24.00/M
Đầu ra:$24.00/M
Z

glm-4-long

Đầu vào:$0.48/M
Đầu ra:$0.48/M
Z

glm-4-flash

Đầu vào:$0.05/M
Đầu ra:$0.05/M
Z

glm-4-airx

Đầu vào:$4.80/M
Đầu ra:$4.80/M
Z

glm-4-air

Đầu vào:$0.48/M
Đầu ra:$0.48/M
Z

glm-4-0520

Đầu vào:$24.00/M
Đầu ra:$24.00/M
Z

glm-4

Đầu vào:$24.00/M
Đầu ra:$24.00/M
Z

glm-3-turbo

Đầu vào:$1.60/M
Đầu ra:$1.60/M