API Phi-4-Mini представляет Microsoftпоследнее новшество в области небольших языковых моделей в серии Phi-4, ориентированное в первую очередь на текстовые заданияБлагодаря компактной структуре, содержащей 3.8 миллиарда параметров, Phi-4-Mini отличается скоростью и эффективностью благодаря своей плотной архитектуре Transformer, состоящей только из декодера.

Основные характеристики Phi-4-Mini
The Модель Фи-4-Мини отличается своей способностью выполнять различные задачи, такие как текстовое рассуждение, математические расчеты, Программирование, и вызовы функций. Несмотря на свой относительно небольшой размер, Phi-4-Mini конкурирует с — и часто превосходит — более крупные языковые модели в следующих областях:
- Текстовое рассуждение: Он отлично справляется с задачами, требующими логической обработки, предлагая производительность, сопоставимую с моделями со значительно большими параметрами.
- Комплексная поддержка длинных текстов: Phi-128-Mini способен обрабатывать последовательности длиной до 4 тыс. токенов и идеально подходит для эффективной обработки объемных текстов.
- Масштабируемая интеграция функций: Возможности вызова функций Phi-4-Mini обеспечивают беспроблемную интеграцию с внешними инструментами, API и источниками данных, повышая его универсальность в прикладных сценариях.
Технические принципы, лежащие в основе Phi-4-Mini
Архитектура Phi-4-Mini основана на сложной технической конструкции, направленной на максимальную эффективность и адаптивность:
- Архитектура трансформатора: Модель построена на основе фреймворка Transformer, предназначенного только для декодирования, и использует механизмы внутреннего внимания для эффективного управления долгосрочными зависимостями в текстовых последовательностях.
- Внимание группового запроса: Этот механизм повышает эффективность вычислений за счет обработки запросов сгруппированными пакетами, что расширяет возможности модели для параллельной обработки.
- Общая стратегия внедрения: Благодаря совместному использованию входных и выходных вложений Phi-4-Mini снижает нагрузку на параметры, повышая адаптивность задач и эффективность работы.
Эти архитектурные решения позволяют Phi-4-Mini добиться превосходных результатов поколение естественного языка сохраняя при этом высокую производительность в различных вариантах использования.
Данные и подробности обучения
Данные по языковой подготовке
Данные для обучения Phi-4-Mini включают высококачественные текстовые данные с богатым рассуждением, особенно тщательно подобранные наборы данных кода для повышения производительности задач программирования. Данные для предварительного обучения улучшены с помощью фильтров и стратегий смешивания данных для обеспечения высокого качества и разнообразия данных. В частности, данные для предварительного обучения включают корпус из 5 триллионов токенов, что больше и качественнее, чем у Phi-3.5-Mini.
Данные обучения визуально-языковому восприятию
Фаза предварительной подготовки Phi-4-Multimodal включает в себя богатые наборы данных изображения-текста, включая перемежающиеся документы изображения-текста, пары изображения-текста, данные локализации изображений и т. д. Процесс предварительной подготовки включает в себя 0.5 триллиона токенов, объединяющих визуальные и текстовые элементы. Фаза контролируемой тонкой настройки (SFT) использует общедоступный набор данных с мультимодальными инструкциями и крупномасштабный внутренний набор данных с мультимодальными инструкциями, охватывающий такие задачи, как понимание естественного изображения, обоснование диаграмм, таблиц и диаграмм, анализ PowerPoint, OCR, сравнение нескольких изображений, суммирование видео и безопасность модели.
Данные визуально-речевого обучения
Phi-4-Multimodal был обучен на визуально-речевых данных, охватывающих как однокадровые, так и многокадровые сценарии. Высокое качество данных было обеспечено путем преобразования пользовательских запросов из текста в аудио с помощью внутреннего движка преобразования текста в речь (TTS). В частности, исследователи использовали внутреннюю модель ASR для транскрибирования аудио и вычисления коэффициента ошибок в словах (WER) между исходным текстом и транскрипцией, а качество окончательных визуально-речевых данных было обеспечено с помощью фильтрации WER.
Данные обучения речи и звука
Данные обучения для функций речи/аудио включают данные транскрипции автоматического распознавания речи (ASR) и данные после обучения, охватывающие различные задачи, такие как автоматический перевод речи (AST), ответ на речевой вопрос (SQA), резюмирование речи (SSUM) и понимание аудио (AU). Данные до обучения включают около 2 миллионов часов анонимизированных внутренних пар «речь-текст», охватывающих 8 поддерживаемых языков. Данные после обучения включают около 100 миллионов тщательно отобранных образцов речи и аудио SFT, охватывающих такие задачи, как ASR, AST, SQA, SQQA, SSUM и AU.
Похожие темы:Лучшие 3 модели ИИ-музыкального генератора 2025 года
Оптимальное развертывание и совместимость
Phi-4-Mini оптимизирован для кроссплатформенная совместимость, облегчая развертывание в различных вычислительных средах:
- ONNXОптимизация времени выполнения: Гарантирует эффективную работу модели в условиях низких затрат и низкой задержки, поддерживая широкое кроссплатформенное применение.
- Среды с ограниченными ресурсами: Благодаря своей легкости Phi-4-Mini подходит для развертывания периферийных вычислений в условиях ограниченных ресурсов, обеспечивая максимальную эффективность работы без ущерба для возможностей.
Философия обучения и использование данных
Процесс обучения Phi-4-Mini является строгим и фокусируется на высококачественных, разнообразных наборах данных для повышения его эффективности. рассуждение и обработка логики возможности:
- Проверенные данные обучения: Включает синтетические и целевые наборы данных для улучшения производительности математических и программных задач.
- Адаптация и точность: Стратегия обучения делает упор на качество и разнообразие данных, подготавливая модель к решению сложных логических задач в различных приложениях.
Примеры использования в реальном мире
Phi-4-Mini предлагает широкий спектр применения в многочисленных сценариях, демонстрируя свою адаптивность и полезность:
- Интеллектуальные системы ответов: Исключительно хорошо справляется со сложными задачами «вопрос-ответ», предоставляя точные и быстрые ответы, подходящие для приложений обслуживания клиентов.
- Помощь в программировании: предлагает разработчикам мощные инструменты для генерации и тестирования кода, повышая производительность и эффективность рабочего процесса.
- Многоязычные возможности: Поддерживает перевод и обработку на нескольких языках, что делает его идеальным для глобальных языковых служб и кросс-культурных приложений.
- Периферийные вычисления и развертывание: Phi-4-Mini оптимизирован для развертывания на портативных устройствах и отлично подходит для сценариев периферийных вычислений, где эффективная обработка имеет первостепенное значение.
Вывод:
Phi-4-Mini с его инновационным дизайном и исключительной производительностью в задачах обработки текста представляет собой значительный прогресс в технологии малых языковых моделей. Эта модель предоставляет разработчикам и пользователям ИИ высокоэффективный инструмент, способный управлять обширными и разнообразными приложениями, не требуя при этом существенных вычислительных ресурсов. По мере развития серии Phi-4 от Microsoft, адаптивность и интеграционные возможности Phi-4-Mini гарантируют его постоянную актуальность и полезность в развивающихся ландшафтах ИИ, в конечном итоге выступая в качестве основного ресурса для будущих разработок в области искусственного интеллекта.
Как вызвать API Phi-4-Mini из CometAPI
1.Войти на cometapi.com. Если вы еще не являетесь нашим пользователем, пожалуйста, зарегистрируйтесь сначала
2.Получите ключ API для доступа к учетным данным интерфейса. Нажмите «Добавить токен» в API-токене в личном центре, получите ключ токена: sk-xxxxx и отправьте.
-
Получите URL этого сайта: https://api.cometapi.com/
-
Выберите конечную точку Phi-4-Mini для отправки запроса API и установите тело запроса. Метод запроса и тело запроса получаются из наш веб-сайт API документ. Для вашего удобства наш сайт также предлагает тест Apifox.
-
Обработайте ответ API, чтобы получить сгенерированный ответ. После отправки запроса API вы получите объект JSON, содержащий сгенерированное завершение.
