API Фи-4-мини

API Phi-4-Mini представляет Microsoftпоследнее новшество в области небольших языковых моделей в серии Phi-4, ориентированное в первую очередь на текстовые заданияБлагодаря компактной структуре, содержащей 3.8 миллиарда параметров, Phi-4-Mini отличается скоростью и эффективностью благодаря своей плотной архитектуре Transformer, состоящей только из декодера.

API Фи-4-мини

Основные характеристики Phi-4-Mini

The Модель Фи-4-Мини отличается своей способностью выполнять различные задачи, такие как текстовое рассуждение, математические расчеты, Программирование, и вызовы функций. Несмотря на свой относительно небольшой размер, Phi-4-Mini конкурирует с — и часто превосходит — более крупные языковые модели в следующих областях:

Текстовое рассуждение: Он отлично справляется с задачами, требующими логической обработки, предлагая производительность, сопоставимую с моделями со значительно большими параметрами.
Комплексная поддержка длинных текстов: Phi-128-Mini способен обрабатывать последовательности длиной до 4 тыс. токенов и идеально подходит для эффективной обработки объемных текстов.
Масштабируемая интеграция функций: Возможности вызова функций Phi-4-Mini обеспечивают беспроблемную интеграцию с внешними инструментами, API и источниками данных, повышая его универсальность в прикладных сценариях.

Технические принципы, лежащие в основе Phi-4-Mini

Архитектура Phi-4-Mini основана на сложной технической конструкции, направленной на максимальную эффективность и адаптивность:

Архитектура трансформатора: Модель построена на основе фреймворка Transformer, предназначенного только для декодирования, и использует механизмы внутреннего внимания для эффективного управления долгосрочными зависимостями в текстовых последовательностях.
Внимание группового запроса: Этот механизм повышает эффективность вычислений за счет обработки запросов сгруппированными пакетами, что расширяет возможности модели для параллельной обработки.
Общая стратегия внедрения: Благодаря совместному использованию входных и выходных вложений Phi-4-Mini снижает нагрузку на параметры, повышая адаптивность задач и эффективность работы.

Эти архитектурные решения позволяют Phi-4-Mini добиться превосходных результатов поколение естественного языка сохраняя при этом высокую производительность в различных вариантах использования.

Данные и подробности обучения

Данные по языковой подготовке

Данные для обучения Phi-4-Mini включают высококачественные текстовые данные с богатым рассуждением, особенно тщательно подобранные наборы данных кода для повышения производительности задач программирования. Данные для предварительного обучения улучшены с помощью фильтров и стратегий смешивания данных для обеспечения высокого качества и разнообразия данных. В частности, данные для предварительного обучения включают корпус из 5 триллионов токенов, что больше и качественнее, чем у Phi-3.5-Mini.

Данные обучения визуально-языковому восприятию

Фаза предварительной подготовки Phi-4-Multimodal включает в себя богатые наборы данных изображения-текста, включая перемежающиеся документы изображения-текста, пары изображения-текста, данные локализации изображений и т. д. Процесс предварительной подготовки включает в себя 0.5 триллиона токенов, объединяющих визуальные и текстовые элементы. Фаза контролируемой тонкой настройки (SFT) использует общедоступный набор данных с мультимодальными инструкциями и крупномасштабный внутренний набор данных с мультимодальными инструкциями, охватывающий такие задачи, как понимание естественного изображения, обоснование диаграмм, таблиц и диаграмм, анализ PowerPoint, OCR, сравнение нескольких изображений, суммирование видео и безопасность модели.

Данные визуально-речевого обучения

Phi-4-Multimodal был обучен на визуально-речевых данных, охватывающих как однокадровые, так и многокадровые сценарии. Высокое качество данных было обеспечено путем преобразования пользовательских запросов из текста в аудио с помощью внутреннего движка преобразования текста в речь (TTS). В частности, исследователи использовали внутреннюю модель ASR для транскрибирования аудио и вычисления коэффициента ошибок в словах (WER) между исходным текстом и транскрипцией, а качество окончательных визуально-речевых данных было обеспечено с помощью фильтрации WER.

Данные обучения речи и звука

Данные обучения для функций речи/аудио включают данные транскрипции автоматического распознавания речи (ASR) и данные после обучения, охватывающие различные задачи, такие как автоматический перевод речи (AST), ответ на речевой вопрос (SQA), резюмирование речи (SSUM) и понимание аудио (AU). Данные до обучения включают около 2 миллионов часов анонимизированных внутренних пар «речь-текст», охватывающих 8 поддерживаемых языков. Данные после обучения включают около 100 миллионов тщательно отобранных образцов речи и аудио SFT, охватывающих такие задачи, как ASR, AST, SQA, SQQA, SSUM и AU.

Оптимальное развертывание и совместимость

Phi-4-Mini оптимизирован для кроссплатформенная совместимость, облегчая развертывание в различных вычислительных средах:

ONNXОптимизация времени выполнения: Гарантирует эффективную работу модели в условиях низких затрат и низкой задержки, поддерживая широкое кроссплатформенное применение.
Среды с ограниченными ресурсами: Благодаря своей легкости Phi-4-Mini подходит для развертывания периферийных вычислений в условиях ограниченных ресурсов, обеспечивая максимальную эффективность работы без ущерба для возможностей.

Философия обучения и использование данных

Процесс обучения Phi-4-Mini является строгим и фокусируется на высококачественных, разнообразных наборах данных для повышения его эффективности. рассуждение и обработка логики возможности:

Проверенные данные обучения: Включает синтетические и целевые наборы данных для улучшения производительности математических и программных задач.
Адаптация и точность: Стратегия обучения делает упор на качество и разнообразие данных, подготавливая модель к решению сложных логических задач в различных приложениях.

Примеры использования в реальном мире

Phi-4-Mini предлагает широкий спектр применения в многочисленных сценариях, демонстрируя свою адаптивность и полезность:

Интеллектуальные системы ответов: Исключительно хорошо справляется со сложными задачами «вопрос-ответ», предоставляя точные и быстрые ответы, подходящие для приложений обслуживания клиентов.
Помощь в программировании: предлагает разработчикам мощные инструменты для генерации и тестирования кода, повышая производительность и эффективность рабочего процесса.
Многоязычные возможности: Поддерживает перевод и обработку на нескольких языках, что делает его идеальным для глобальных языковых служб и кросс-культурных приложений.
Периферийные вычисления и развертывание: Phi-4-Mini оптимизирован для развертывания на портативных устройствах и отлично подходит для сценариев периферийных вычислений, где эффективная обработка имеет первостепенное значение.

Вывод:

Phi-4-Mini с его инновационным дизайном и исключительной производительностью в задачах обработки текста представляет собой значительный прогресс в технологии малых языковых моделей. Эта модель предоставляет разработчикам и пользователям ИИ высокоэффективный инструмент, способный управлять обширными и разнообразными приложениями, не требуя при этом существенных вычислительных ресурсов. По мере развития серии Phi-4 от Microsoft, адаптивность и интеграционные возможности Phi-4-Mini гарантируют его постоянную актуальность и полезность в развивающихся ландшафтах ИИ, в конечном итоге выступая в качестве основного ресурса для будущих разработок в области искусственного интеллекта.

Как вызвать API Phi-4-Mini из CometAPI

1.Войти на cometapi.com. Если вы еще не являетесь нашим пользователем, пожалуйста, зарегистрируйтесь сначала

2.Получите ключ API для доступа к учетным данным интерфейса. Нажмите «Добавить токен» в API-токене в личном центре, получите ключ токена: sk-xxxxx и отправьте.

Получите URL этого сайта: https://api.cometapi.com/
Выберите конечную точку Phi-4-Mini для отправки запроса API и установите тело запроса. Метод запроса и тело запроса получаются из наш веб-сайт API документ. Для вашего удобства наш сайт также предлагает тест Apifox.
Обработайте ответ API, чтобы получить сгенерированный ответ. После отправки запроса API вы получите объект JSON, содержащий сгенерированное завершение.