API Phi-4-Mini mewakili MicrosoftInovasi terbaru dalam model bahasa kecil dalam seri Phi-4, dengan fokus utama pada tugas teksDengan kerangka kerja kompak yang menampung 3.8 miliar parameter, Phi-4-Mini unggul dalam kecepatan dan efisiensi berkat arsitektur Transformer khusus dekoder yang padat.

Karakteristik Utama Phi-4-Mini
The Model Phi-4-Mini luar biasa karena kemampuannya untuk melakukan berbagai tugas seperti penalaran teks, perhitungan matematis, pemrograman, dan pemanggilan fungsi. Meskipun ukurannya relatif kecil, Phi-4-Mini bersaing dengan—dan sering kali melampaui—model bahasa yang lebih besar di area berikut:
- Penalaran Teks: Unggul dalam tugas yang memerlukan pemrosesan logis, menawarkan kinerja yang mirip dengan model dengan parameter yang jauh lebih besar.
- Dukungan Komprehensif untuk Teks Panjang: Mampu memproses urutan hingga 128K token, Phi-4-Mini ideal untuk menangani teks yang luas secara efisien.
- Integrasi Fungsi yang Dapat DiskalakanKemampuan pemanggilan fungsi Phi-4-Mini memungkinkan integrasi yang mulus dengan alat eksternal, API, dan sumber data, meningkatkan fleksibilitasnya dalam skenario aplikasi.
Prinsip Teknis di Balik Phi-4-Mini
Arsitektur Phi-4-Mini didasarkan pada desain teknis canggih yang bertujuan untuk memaksimalkan efisiensi dan kemampuan beradaptasi:
- Arsitektur Transformator:Model ini dibangun pada kerangka kerja Transformer khusus dekoder, memanfaatkan mekanisme perhatian mandiri untuk mengelola ketergantungan jangka panjang dalam rangkaian teks secara efektif.
- Perhatian Kueri yang DikelompokkanMekanisme ini meningkatkan efisiensi komputasi dengan memproses kueri dalam kelompok yang dikelompokkan, sehingga meningkatkan kapasitas model untuk pemrosesan paralel.
- Strategi Penanaman Bersama: Dengan berbagi penyematan input dan output, Phi-4-Mini mengurangi beban parameter, meningkatkan kemampuan beradaptasi tugas dan efisiensi operasional.
Pilihan arsitektur ini menyesuaikan Phi-4-Mini untuk unggul dalam generasi bahasa alami sambil mempertahankan kinerja tinggi di berbagai kasus penggunaan.
Detail Data dan Pelatihan
Data Pelatihan Bahasa
Data pelatihan untuk Phi-4-Mini mencakup data teks yang kaya akan penalaran berkualitas tinggi, khususnya kumpulan data kode yang dikurasi dengan cermat untuk meningkatkan kinerja tugas pemrograman. Data pra-pelatihan ditingkatkan dengan filter dan strategi pencampuran data untuk memastikan kualitas dan keragaman data yang tinggi. Secara khusus, data pra-pelatihan mencakup korpus 5 triliun token, yang lebih besar dan berkualitas lebih tinggi daripada Phi-3.5-Mini.
Data Pelatihan Bahasa Penglihatan
Tahap pra-pelatihan Phi-4-Multimodal melibatkan kumpulan data gambar-teks yang kaya, termasuk dokumen gambar-teks yang disisipkan, pasangan gambar-teks, data pelokalan gambar, dll. Proses pra-pelatihan melibatkan 0.5 triliun token, yang menggabungkan elemen visual dan tekstual. Tahap penyempurnaan terbimbing (SFT) menggunakan kumpulan data yang disesuaikan dengan instruksi multimodal publik dan kumpulan data yang disesuaikan dengan instruksi multimodal internal berskala besar, yang mencakup tugas-tugas seperti pemahaman gambar alami, penalaran bagan, tabel, dan diagram, analisis PowerPoint, OCR, perbandingan multi-gambar, ringkasan video, dan keamanan model.
Data Pelatihan Visual-Ucapan
Phi-4-Multimodal dilatih pada data visual-ucapan, yang mencakup skenario bingkai tunggal dan multi-bingkai. Kualitas data yang tinggi dipastikan dengan mengubah kueri pengguna dari teks ke audio melalui mesin text-to-speech (TTS) internal. Secara khusus, para peneliti menggunakan model ASR internal untuk menyalin audio dan menghitung rasio kesalahan kata (WER) antara teks asli dan transkripsi, dan kualitas data visual-ucapan akhir dipastikan melalui penyaringan WER.
Data Pelatihan Ucapan dan Audio
Data pelatihan untuk fitur ucapan/audio mencakup data transkripsi pengenalan ucapan otomatis (ASR) dan data pasca-pelatihan, yang mencakup berbagai tugas seperti penerjemahan ucapan otomatis (AST), menjawab pertanyaan ucapan (SQA), meringkas ucapan (SSUM), dan pemahaman audio (AU). Data pra-pelatihan mencakup sekitar 2 juta jam pasangan ucapan-teks internal anonim, yang mencakup 8 bahasa yang didukung. Data pasca-pelatihan mencakup sekitar 100 juta sampel SFT ucapan dan audio yang dikurasi dengan cermat, yang mencakup tugas-tugas seperti ASR, AST, SQA, SQQA, SSUM, dan AU.
Topik terkait:3 Model Generasi Musik AI Terbaik Tahun 2025
Penerapan dan Kompatibilitas yang Optimal
Phi-4-Mini dioptimalkan untuk kompatibilitas lintas platform, memfasilitasi penerapan di berbagai lingkungan komputasi:
- Pengoptimalan ONNXRuntime: Memastikan model berkinerja efisien dalam pengaturan biaya rendah dan latensi rendah, mendukung aplikasi lintas-platform yang luas.
- Lingkungan dengan keterbatasan sumber dayaSifatnya yang ringan membuat Phi-4-Mini cocok untuk penerapan komputasi tepi di mana sumber dayanya terbatas, memaksimalkan efisiensi operasional tanpa mengorbankan kemampuan.
Filosofi Pelatihan dan Pemanfaatan Data
Proses pelatihan Phi-4-Mini sangat ketat, berfokus pada kumpulan data berkualitas tinggi dan beragam untuk mendukung pemikiran dan penanganan logika kemampuan:
- Data Pelatihan yang Disaring: Menggabungkan kumpulan data sintetis dan tertarget untuk menyempurnakan kinerja tugas matematika dan pemrogramannya.
- Adaptasi dan PresisiStrategi pelatihan menekankan kualitas dan keberagaman data, mempersiapkan model untuk tugas-tugas penalaran kompleks di berbagai aplikasi.
Kasus Penggunaan Dunia Nyata
Phi-4-Mini menawarkan aplikasi luas dalam berbagai skenario, menunjukkan kemampuan beradaptasi dan kegunaannya:
- Sistem Jawaban Cerdas: Berkinerja sangat baik dalam tugas tanya jawab yang rumit, memberikan respons yang akurat dan cepat yang cocok untuk aplikasi layanan pelanggan.
- Bantuan Pemrograman: Menawarkan kepada pengembang berbagai alat yang hebat untuk pembuatan dan pengujian kode, guna meningkatkan produktivitas dan efisiensi alur kerja.
- Kemampuan Multibahasa: Mendukung penerjemahan dan pemrosesan berbagai bahasa, menjadikannya ideal untuk layanan bahasa global dan aplikasi lintas budaya.
- Komputasi Tepi dan Penerapan: Dioptimalkan untuk penerapan perangkat portabel, Phi-4-Mini berkembang pesat dalam skenario komputasi tepi yang mengutamakan pemrosesan efisien.
Kesimpulan:
Phi-4-Mini, dengan desain inovatif dan kinerja luar biasa dalam tugas pemrosesan teks, merupakan kemajuan signifikan dalam teknologi model bahasa kecil. Model ini menyediakan alat efisiensi tinggi bagi pengembang dan pengguna AI yang mampu mengelola aplikasi yang luas dan beragam tanpa menuntut sumber daya komputasi yang besar. Seiring dengan perkembangan seri Phi-4 Microsoft, kemampuan adaptasi dan integrasi Phi-4-Mini memastikan relevansi dan kegunaannya yang berkelanjutan dalam lanskap AI yang terus berkembang, yang pada akhirnya berfungsi sebagai sumber daya penting untuk pengembangan kecerdasan buatan di masa mendatang.
Cara memanggil API Phi-4-Mini ini dari CometAPI
1.Masuk ke cometapi.com. Jika Anda belum menjadi pengguna kami, silakan mendaftar terlebih dahulu
2.Dapatkan kunci API kredensial akses antarmuka. Klik “Tambahkan Token” pada token API di pusat personal, dapatkan kunci token: sk-xxxxx dan kirimkan.
-
Dapatkan url situs ini: https://api.cometapi.com/
-
Pilih titik akhir Phi-4-Mini untuk mengirim permintaan API dan atur badan permintaan. Metode permintaan dan badan permintaan diperoleh dari dokumen API situs web kamiSitus web kami juga menyediakan uji coba Apifox demi kenyamanan Anda.
-
Memproses respons API untuk mendapatkan jawaban yang dihasilkan. Setelah mengirim permintaan API, Anda akan menerima objek JSON yang berisi penyelesaian yang dihasilkan.
