파이-4-미니 API

CometAPI
AnnaMar 9, 2025
파이-4-미니 API

Phi-4-Mini API는 다음을 나타냅니다. MicrosoftPhi-4 시리즈 내 소규모 언어 모델의 최신 혁신은 주로 다음에 초점을 맞춥니다. 텍스트 작업. 3.8억 개의 매개변수를 수용하는 컴팩트한 프레임워크를 갖춘 Phi-4-Mini는 고밀도 디코더 전용 Transformer 아키텍처 덕분에 속도와 효율성이 뛰어납니다.

파이-4-미니 API

Phi-4-Mini의 주요 특징

The 파이-4-미니 모델 다양한 작업을 수행하는 능력으로 주목할 만합니다. 텍스트 추론, 수학적 계산, 프로그래밍, 및 함수 호출. 비교적 작은 크기에도 불구하고 Phi-4-Mini는 다음 영역에서 더 큰 언어 모델과 경쟁하고 종종 능가합니다.

  • 텍스트 추론: 논리적 처리가 필요한 작업에 뛰어나며 훨씬 더 큰 매개변수를 가진 모델과 유사한 성능을 제공합니다.
  • 긴 텍스트에 대한 포괄적인 지원: 최대 128K 토큰의 시퀀스를 처리할 수 있는 Phi-4-Mini는 방대한 텍스트를 효율적으로 처리하는 데 이상적입니다.
  • 확장 가능한 기능 통합: Phi-4-Mini의 함수 호출 기능을 통해 외부 도구, API, 데이터 소스와의 원활한 통합이 가능해져 애플리케이션 시나리오에서 다양성이 더욱 향상됩니다.

Phi-4-Mini의 기술적 원리

Phi-4-Mini의 아키텍처는 효율성과 적응성을 극대화하는 것을 목표로 한 정교한 기술 설계에 기반을 두고 있습니다.

  • 트랜스포머 아키텍처: 이 모델은 디코더 전용 Transformer 프레임워크 기반으로 구축되어 셀프 어텐션 메커니즘을 활용해 텍스트 시퀀스 내의 장기 종속성을 효과적으로 관리합니다.
  • 그룹화된 쿼리 주의: 이 메커니즘은 그룹화된 배치로 쿼리를 처리하여 계산 효율성을 높이고 모델의 병렬 처리 용량을 강화합니다.
  • 공유 임베딩 전략: Phi-4-Mini는 입력 및 출력 임베딩을 공유함으로써 매개변수 부하를 줄이고 작업 적응성과 운영 효율성을 향상시킵니다.

이러한 건축적 선택은 Phi-4-Mini가 탁월해지도록 맞춤화합니다. 자연어 생성 다양한 사용 사례에서 높은 성능을 유지합니다.

데이터 및 교육 세부 정보

언어 훈련 데이터

Phi-4-Mini의 훈련 데이터에는 고품질 추론이 풍부한 텍스트 데이터, 특히 프로그래밍 작업의 성능을 향상시키기 위해 신중하게 큐레이팅된 코드 데이터 세트가 포함됩니다. 사전 훈련 데이터는 필터와 데이터 혼합 전략으로 개선되어 데이터의 고품질과 다양성을 보장합니다. 구체적으로 사전 훈련 데이터에는 Phi-5-Mini보다 더 크고 품질이 더 높은 3.5조 개의 토큰 코퍼스가 포함됩니다.

비전-언어 훈련 데이터

Phi-4-Multimodal의 사전 학습 단계에는 인터리브된 이미지-텍스트 문서, 이미지-텍스트 쌍, 이미지 로컬라이제이션 데이터 등을 포함한 풍부한 이미지-텍스트 데이터 세트가 포함됩니다. 사전 학습 프로세스에는 시각적 요소와 텍스트적 요소를 결합한 0.5조 개의 토큰이 포함됩니다. 감독 미세 조정(SFT) 단계는 공개 멀티모달 명령어 조정 데이터 세트와 대규모 내부 멀티모달 명령어 조정 데이터 세트를 사용하여 자연스러운 이미지 이해, 차트, 표 및 다이어그램 추론, PowerPoint 분석, OCR, 다중 이미지 비교, 비디오 요약 및 모델 보안과 같은 작업을 포함합니다.

시각-음성 훈련 데이터

Phi-4-Multimodal은 단일 프레임과 다중 프레임 시나리오를 모두 포함하는 시각-음성 데이터에서 학습되었습니다. 내부 텍스트-음성(TTS) 엔진을 통해 사용자 질의를 텍스트에서 오디오로 변환하여 데이터의 높은 품질을 보장했습니다. 구체적으로 연구자들은 내부 ASR 모델을 사용하여 오디오를 필사하고 원본 텍스트와 필사본 간의 단어 오류율(WER)을 계산했으며, 최종 시각-음성 데이터의 품질은 WER 필터링을 통해 보장되었습니다.

음성 및 오디오 교육 데이터

음성/오디오 기능에 대한 훈련 데이터에는 자동 음성 인식(ASR) 전사 데이터와 훈련 후 데이터가 포함되어 있으며, 자동 음성 번역(AST), 음성 질의 응답(SQA), 음성 요약(SSUM), 오디오 이해(AU)와 같은 다양한 작업을 포함합니다. 사전 훈련 데이터에는 약 2만 시간의 익명화된 내부 음성-텍스트 쌍이 포함되어 있으며, 8개 지원 언어를 포함합니다. 사후 훈련 데이터에는 약 100억 개의 신중하게 큐레이팅된 음성 및 오디오 SFT 샘플이 포함되어 있으며, ASR, AST, SQA, SQQA, SSUM, AU와 같은 작업을 포함합니다.

관련 주제:3년 최고의 2025가지 AI 음악 생성 모델

최적의 배포 및 호환성

Phi-4-Mini는 다음에 최적화되었습니다. 플랫폼 간 호환성다양한 컴퓨팅 환경에서의 배포를 용이하게 함:

  • ONNX런타임 최적화: 모델이 저비용, 저지연 환경에서 효율적으로 수행되도록 보장하여 광범위한 플랫폼 간 애플리케이션을 지원합니다.
  • 리소스가 제한된 환경: 가벼운 특성 덕분에 Phi-4-Mini는 리소스가 제한된 엣지 컴퓨팅 배포에 적합하며 성능을 저하시키지 않으면서도 운영 효율성을 극대화합니다.

교육 철학 및 데이터 활용

Phi-4-Mini의 훈련 프로세스는 엄격하며 다양한 고품질 데이터 세트에 중점을 두고 강화됩니다. 추리논리 처리 기능 :

  • 선별된 훈련 데이터: 합성적이고 타겟화된 데이터 세트를 통합하여 수학적, 프로그래밍 작업 성능을 개선합니다.
  • 적응과 정밀성: 훈련 전략은 데이터 품질과 다양성을 강조하며, 다양한 응용 프로그램에서 복잡한 추론 작업을 위한 모델을 준비합니다.

실제 사용 사례

Phi-4-Mini는 다양한 시나리오에서 광범위한 응용 프로그램을 제공하며 적응성과 유용성을 보여줍니다.

  • 지능형 답변 시스템: 복잡한 질문-답변 작업에서 매우 뛰어난 성능을 발휘하며, 고객 서비스 애플리케이션에 적합한 정확하고 신속한 응답을 제공합니다.
  • 프로그래밍 지원: 개발자에게 코드 생성 및 테스트를 위한 강력한 도구를 제공하여 생산성과 워크플로 효율성을 향상시킵니다.
  • 다국어 기능: 여러 언어에 대한 번역과 처리를 지원하므로 글로벌 언어 서비스와 문화 간 애플리케이션에 이상적입니다.
  • 엣지 컴퓨팅 및 배포: 휴대용 장치 배포에 최적화된 Phi-4-Mini는 효율적인 처리가 가장 중요한 엣지 컴퓨팅 시나리오에서 탁월한 성능을 발휘합니다.

결론 :

혁신적인 디자인과 텍스트 처리 작업에서 뛰어난 성능을 보이는 Phi-4-Mini는 소규모 언어 모델 기술에서 상당한 발전을 나타냅니다. 이 모델은 개발자와 AI 사용자에게 상당한 계산 리소스를 요구하지 않고도 광범위하고 다양한 애플리케이션을 관리할 수 있는 고효율 도구를 제공합니다. Microsoft의 Phi-4 시리즈가 발전함에 따라 Phi-4-Mini의 적응성과 통합 기능은 진화하는 AI 환경에서 지속적인 관련성과 유용성을 보장하며 궁극적으로 인공 지능의 미래 개발을 위한 핵심 리소스 역할을 합니다.

CometAPI에서 이 Phi-4-Mini API를 호출하는 방법

1.로그인 cometapi.com으로. 아직 당사 사용자가 아니라면 먼저 등록하세요.

2.액세스 자격 증명 API 키 가져오기 인터페이스의. 개인 센터의 API 토큰에서 "토큰 추가"를 클릭하고 토큰 키: sk-xxxxx를 가져와 제출합니다.

  1. 이 사이트의 url을 얻으세요: https://api.cometapi.com/

  2. API 요청을 보낼 Phi-4-Mini 엔드포인트를 선택하고 요청 본문을 설정합니다. 요청 메서드와 요청 본문은 다음에서 가져옵니다. 우리 웹사이트 API 문서. 저희 웹사이트는 귀하의 편의를 위해 Apifox 테스트도 제공합니다.

  3. API 응답을 처리하여 생성된 답변을 얻습니다. API 요청을 보낸 후 생성된 완료를 포함하는 JSON 객체를 받게 됩니다.

더 보기

하나의 API로 500개 이상의 모델

최대 20% 할인