Thông số kỹ thuật của `gpt-4o-mini-search-preview`

Thông số	Chi tiết
ID mô hình	`gpt-4o-mini-search-preview`
Họ mô hình	GPT-4o mini
Mô thức chính	Đa phương thức
Đầu vào được hỗ trợ	Văn bản, hình ảnh
Thế mạnh cốt lõi	Tương tác hướng tìm kiếm, hiểu truy vấn, tổng hợp câu trả lời ngắn gọn, hỗ trợ quy trình truy xuất
Khả năng tuân thủ hướng dẫn	Hỗ trợ mạnh cho nhắc lệnh có hướng dẫn và định dạng tác vụ
Đầu ra có cấu trúc	Phù hợp với JSON và các định dạng phản hồi dựa trên lược đồ khác
Khả năng dùng công cụ	Thiết kế để hoạt động tốt với tìm kiếm bên ngoài và gọi hàm/công cụ
Hồ sơ độ trễ/chi phí điển hình	Mô hình gọn nhẹ, tối ưu cho triển khai nhẹ và các trường hợp sử dụng thông lượng cao
Trường hợp sử dụng phổ biến	Trợ lý tìm kiếm trong sản phẩm, hỏi đáp cơ sở tri thức, khám phá thương mại điện tử, hiểu truy vấn phục vụ xếp hạng/định tuyến, pipeline RAG

`gpt-4o-mini-search-preview` là gì?

gpt-4o-mini-search-preview là một mô hình đa phương thức gọn nhẹ thuộc họ GPT-4o, được xây dựng cho các trải nghiệm lấy tìm kiếm làm trung tâm và các ứng dụng tăng cường truy xuất. Mô hình phù hợp với các hệ thống cần diễn giải ý định người dùng, viết lại hoặc phân rã truy vấn, tổng hợp phản hồi ngắn gọn từ thông tin đã truy xuất và hỗ trợ các quy trình có căn cứ thông qua tích hợp tìm kiếm bên ngoài.

Vì chấp nhận cả đầu vào văn bản và hình ảnh, mô hình có thể tham gia vào các trải nghiệm khám phá và hỗ trợ vượt ra ngoài tìm kiếm văn bản thuần túy. Mô hình đặc biệt hữu ích trong các ứng dụng nơi việc hiểu truy vấn nhanh, định dạng phản hồi có kiểm soát và điều phối qua công cụ quan trọng hơn là tạo văn bản dài. Ví dụ phổ biến bao gồm trợ lý tìm kiếm hướng tới khách hàng, trợ lý tri thức nội bộ, luồng khám phá sản phẩm và pipeline truy xuất phụ thuộc vào phân loại truy vấn, hỗ trợ xếp hạng và tạo câu trả lời.

Tính năng chính của `gpt-4o-mini-search-preview`

Lý luận định hướng tìm kiếm: Giúp diễn giải ý định người dùng mơ hồ, tái tạo truy vấn và hỗ trợ tương tác tập trung vào truy xuất.
Hỗ trợ đầu vào đa phương thức: Chấp nhận cả văn bản và hình ảnh, cho phép luồng tìm kiếm và khám phá phong phú hơn.
Tổng hợp câu trả lời súc tích: Tạo tóm tắt ngắn gọn, hữu ích và phản hồi trực tiếp phù hợp với trải nghiệm tìm kiếm.
Sẵn sàng tích hợp công cụ: Hoạt động hiệu quả với gọi hàm và công cụ bên ngoài cho tìm kiếm, duyệt và điều phối RAG.
Tương thích đầu ra có cấu trúc: Có thể tạo phản hồi ở định dạng có tổ chức như JSON cho các hệ thống hạ nguồn.
Khả năng tuân thủ hướng dẫn: Xử lý nhắc lệnh có hướng dẫn một cách đáng tin cậy cho phân loại, định tuyến, trích xuất và định dạng câu trả lời.
Hỗ trợ hỏi đáp trên cơ sở tri thức: Phù hợp với hệ thống truy xuất tài liệu trước rồi yêu cầu mô hình tạo câu trả lời có căn cứ.
Khám phá thương mại điện tử và danh mục: Hữu ích cho việc diễn giải ý định mua sắm, tinh chỉnh bộ lọc và cải thiện tương tác tìm kiếm sản phẩm.
Hỗ trợ xếp hạng và định tuyến: Giúp phân loại truy vấn và chuẩn bị cho truy xuất, xếp hạng hoặc nhánh hóa quy trình.
Hồ sơ triển khai hiệu quả: Là mô hình gọn nhẹ, phù hợp với tích hợp có thể mở rộng, cân nhắc chi phí nhưng vẫn cần hành vi đa phương thức và nhận biết công cụ.

Cách truy cập và tích hợp `gpt-4o-mini-search-preview`

Bước 1: Đăng ký lấy API Key

Bắt đầu bằng cách tạo tài khoản trên CometAPI và tạo khóa API từ bảng điều khiển. Sau đó, lưu trữ khóa một cách an toàn và sử dụng nó trong header Authorization cho mọi yêu cầu.

Bước 2: Gửi yêu cầu tới API `gpt-4o-mini-search-preview`

Sử dụng endpoint tương thích OpenAI của CometAPI và chỉ định mô hình là gpt-4o-mini-search-preview.

curl https://api.cometapi.com/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $COMETAPI_API_KEY" \
  -d '{
    "model": "gpt-4o-mini-search-preview",
    "messages": [
      {
        "role": "user",
        "content": "Summarize the main intent behind this search query: best running shoes for flat feet"
      }
    ]
  }'

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_COMETAPI_API_KEY",
    base_url="https://api.cometapi.com/v1"
)

response = client.chat.completions.create(
    model="gpt-4o-mini-search-preview",
    messages=[
        {
            "role": "user",
            "content": "Summarize the main intent behind this search query: best running shoes for flat feet"
        }
    ]
)

print(response.choices[0].message.content)

Bước 3: Truy xuất và xác minh kết quả

Phân tích đầu ra của mô hình trong ứng dụng của bạn và khi cần, ghép chuỗi với các bước truy xuất, xếp hạng lại hoặc xác minh. Đối với hệ thống tìm kiếm và RAG trong môi trường sản xuất, nên xác thực đầu ra dựa trên nguồn tin cậy và ghi log phản hồi để giám sát chất lượng.

Thông số kỹ thuật của `gpt-4o-mini-search-preview`

Thông số	Chi tiết
ID mô hình	`gpt-4o-mini-search-preview`
Họ mô hình	GPT-4o mini
Mô thức chính	Đa phương thức
Đầu vào được hỗ trợ	Văn bản, hình ảnh
Thế mạnh cốt lõi	Tương tác hướng tìm kiếm, hiểu truy vấn, tổng hợp câu trả lời ngắn gọn, hỗ trợ quy trình truy xuất
Khả năng tuân thủ hướng dẫn	Hỗ trợ mạnh cho nhắc lệnh có hướng dẫn và định dạng tác vụ
Đầu ra có cấu trúc	Phù hợp với JSON và các định dạng phản hồi dựa trên lược đồ khác
Khả năng dùng công cụ	Thiết kế để hoạt động tốt với tìm kiếm bên ngoài và gọi hàm/công cụ
Hồ sơ độ trễ/chi phí điển hình	Mô hình gọn nhẹ, tối ưu cho triển khai nhẹ và các trường hợp sử dụng thông lượng cao
Trường hợp sử dụng phổ biến	Trợ lý tìm kiếm trong sản phẩm, hỏi đáp cơ sở tri thức, khám phá thương mại điện tử, hiểu truy vấn phục vụ xếp hạng/định tuyến, pipeline RAG