API Фи-4-мини

CometAPI
AnnaMar 9, 2025
API Фи-4-мини

API Phi-4-Mini представляет Microsoftпоследнее новшество в области небольших языковых моделей в серии Phi-4, ориентированное в первую очередь на текстовые заданияБлагодаря компактной структуре, содержащей 3.8 миллиарда параметров, Phi-4-Mini отличается скоростью и эффективностью благодаря своей плотной архитектуре Transformer, состоящей только из декодера.

API Фи-4-мини

Основные характеристики Phi-4-Mini

The Модель Фи-4-Мини отличается своей способностью выполнять различные задачи, такие как текстовое рассуждение, математические расчеты, Программирование, и вызовы функций. Несмотря на свой относительно небольшой размер, Phi-4-Mini конкурирует с — и часто превосходит — более крупные языковые модели в следующих областях:

  • Текстовое рассуждение: Он отлично справляется с задачами, требующими логической обработки, предлагая производительность, сопоставимую с моделями со значительно большими параметрами.
  • Комплексная поддержка длинных текстов: Phi-128-Mini способен обрабатывать последовательности длиной до 4 тыс. токенов и идеально подходит для эффективной обработки объемных текстов.
  • Масштабируемая интеграция функций: Возможности вызова функций Phi-4-Mini обеспечивают беспроблемную интеграцию с внешними инструментами, API и источниками данных, повышая его универсальность в прикладных сценариях.

Технические принципы, лежащие в основе Phi-4-Mini

Архитектура Phi-4-Mini основана на сложной технической конструкции, направленной на максимальную эффективность и адаптивность:

  • Архитектура трансформатора: Модель построена на основе фреймворка Transformer, предназначенного только для декодирования, и использует механизмы внутреннего внимания для эффективного управления долгосрочными зависимостями в текстовых последовательностях.
  • Внимание группового запроса: Этот механизм повышает эффективность вычислений за счет обработки запросов сгруппированными пакетами, что расширяет возможности модели для параллельной обработки.
  • Общая стратегия внедрения: Благодаря совместному использованию входных и выходных вложений Phi-4-Mini снижает нагрузку на параметры, повышая адаптивность задач и эффективность работы.

Эти архитектурные решения позволяют Phi-4-Mini добиться превосходных результатов поколение естественного языка сохраняя при этом высокую производительность в различных вариантах использования.

Данные и подробности обучения

Данные по языковой подготовке

Данные для обучения Phi-4-Mini включают высококачественные текстовые данные с богатым рассуждением, особенно тщательно подобранные наборы данных кода для повышения производительности задач программирования. Данные для предварительного обучения улучшены с помощью фильтров и стратегий смешивания данных для обеспечения высокого качества и разнообразия данных. В частности, данные для предварительного обучения включают корпус из 5 триллионов токенов, что больше и качественнее, чем у Phi-3.5-Mini.

Данные обучения визуально-языковому восприятию

Фаза предварительной подготовки Phi-4-Multimodal включает в себя богатые наборы данных изображения-текста, включая перемежающиеся документы изображения-текста, пары изображения-текста, данные локализации изображений и т. д. Процесс предварительной подготовки включает в себя 0.5 триллиона токенов, объединяющих визуальные и текстовые элементы. Фаза контролируемой тонкой настройки (SFT) использует общедоступный набор данных с мультимодальными инструкциями и крупномасштабный внутренний набор данных с мультимодальными инструкциями, охватывающий такие задачи, как понимание естественного изображения, обоснование диаграмм, таблиц и диаграмм, анализ PowerPoint, OCR, сравнение нескольких изображений, суммирование видео и безопасность модели.

Данные визуально-речевого обучения

Phi-4-Multimodal был обучен на визуально-речевых данных, охватывающих как однокадровые, так и многокадровые сценарии. Высокое качество данных было обеспечено путем преобразования пользовательских запросов из текста в аудио с помощью внутреннего движка преобразования текста в речь (TTS). В частности, исследователи использовали внутреннюю модель ASR для транскрибирования аудио и вычисления коэффициента ошибок в словах (WER) между исходным текстом и транскрипцией, а качество окончательных визуально-речевых данных было обеспечено с помощью фильтрации WER.

Данные обучения речи и звука

Данные обучения для функций речи/аудио включают данные транскрипции автоматического распознавания речи (ASR) и данные после обучения, охватывающие различные задачи, такие как автоматический перевод речи (AST), ответ на речевой вопрос (SQA), резюмирование речи (SSUM) и понимание аудио (AU). Данные до обучения включают около 2 миллионов часов анонимизированных внутренних пар «речь-текст», охватывающих 8 поддерживаемых языков. Данные после обучения включают около 100 миллионов тщательно отобранных образцов речи и аудио SFT, охватывающих такие задачи, как ASR, AST, SQA, SQQA, SSUM и AU.

Похожие темы:Лучшие 3 модели ИИ-музыкального генератора 2025 года

Оптимальное развертывание и совместимость

Phi-4-Mini оптимизирован для кроссплатформенная совместимость, облегчая развертывание в различных вычислительных средах:

  • ONNXОптимизация времени выполнения: Гарантирует эффективную работу модели в условиях низких затрат и низкой задержки, поддерживая широкое кроссплатформенное применение.
  • Среды с ограниченными ресурсами: Благодаря своей легкости Phi-4-Mini подходит для развертывания периферийных вычислений в условиях ограниченных ресурсов, обеспечивая максимальную эффективность работы без ущерба для возможностей.

Философия обучения и использование данных

Процесс обучения Phi-4-Mini является строгим и фокусируется на высококачественных, разнообразных наборах данных для повышения его эффективности. рассуждение и обработка логики возможности:

  • Проверенные данные обучения: Включает синтетические и целевые наборы данных для улучшения производительности математических и программных задач.
  • Адаптация и точность: Стратегия обучения делает упор на качество и разнообразие данных, подготавливая модель к решению сложных логических задач в различных приложениях.

Примеры использования в реальном мире

Phi-4-Mini предлагает широкий спектр применения в многочисленных сценариях, демонстрируя свою адаптивность и полезность:

  • Интеллектуальные системы ответов: Исключительно хорошо справляется со сложными задачами «вопрос-ответ», предоставляя точные и быстрые ответы, подходящие для приложений обслуживания клиентов.
  • Помощь в программировании: предлагает разработчикам мощные инструменты для генерации и тестирования кода, повышая производительность и эффективность рабочего процесса.
  • Многоязычные возможности: Поддерживает перевод и обработку на нескольких языках, что делает его идеальным для глобальных языковых служб и кросс-культурных приложений.
  • Периферийные вычисления и развертывание: Phi-4-Mini оптимизирован для развертывания на портативных устройствах и отлично подходит для сценариев периферийных вычислений, где эффективная обработка имеет первостепенное значение.

Вывод:

Phi-4-Mini с его инновационным дизайном и исключительной производительностью в задачах обработки текста представляет собой значительный прогресс в технологии малых языковых моделей. Эта модель предоставляет разработчикам и пользователям ИИ высокоэффективный инструмент, способный управлять обширными и разнообразными приложениями, не требуя при этом существенных вычислительных ресурсов. По мере развития серии Phi-4 от Microsoft, адаптивность и интеграционные возможности Phi-4-Mini гарантируют его постоянную актуальность и полезность в развивающихся ландшафтах ИИ, в конечном итоге выступая в качестве основного ресурса для будущих разработок в области искусственного интеллекта.

Как вызвать API Phi-4-Mini из CometAPI

1.Войти на cometapi.com. Если вы еще не являетесь нашим пользователем, пожалуйста, зарегистрируйтесь сначала

2.Получите ключ API для доступа к учетным данным интерфейса. Нажмите «Добавить токен» в API-токене в личном центре, получите ключ токена: sk-xxxxx и отправьте.

  1. Получите URL этого сайта: https://api.cometapi.com/

  2. Выберите конечную точку Phi-4-Mini для отправки запроса API и установите тело запроса. Метод запроса и тело запроса получаются из наш веб-сайт API документ. Для вашего удобства наш сайт также предлагает тест Apifox.

  3. Обработайте ответ API, чтобы получить сгенерированный ответ. После отправки запроса API вы получите объект JSON, содержащий сгенерированное завершение.

Читать далее

500+ моделей в одном API

Скидка до 20%