Gemma 3n: Özellik, Mimariler ve daha fazlası

Google'ın en son cihaz içi yapay zekası, Gemma 3n, son teknoloji ürünü üretken modelleri kompakt, verimli ve gizliliği koruyan hale getirmede bir sıçramayı temsil ediyor. Mayıs 2025'in sonlarında Google I/O'da önizleme olarak piyasaya sürülen Gemma 3n, gelişmiş çok modlu AI yeteneklerini doğrudan mobil ve uç cihazlara getirdiği için geliştiriciler ve araştırmacılar arasında şimdiden heyecan yaratıyor. Bu makale en son duyuruları, geliştirici içgörülerini ve bağımsız kıyaslamaları bir araya getiriyor.

Gemma 3n Nedir?

Gemma 3n, Google'ın Gemma jeneratif AI modelleri ailesinin en yeni üyesidir ve özel olarak tasarlanmıştır. cihazda akıllı telefonlar, tabletler ve gömülü sistemler gibi kaynak kısıtlı donanımlarda çıkarım. Gemma 3 ve daha önceki varyantları gibi bulut veya tek GPU kullanımı için optimize edilmiş seleflerinin aksine, Gemma 3n'nin mimarisi öncelik verir düşük gecikme süresi, azaltılmış bellek alanı, ve dinamik kaynak kullanımıKullanıcıların sürekli bir İnternet bağlantısı olmadan gelişmiş yapay zeka özelliklerini çalıştırabilmelerini sağlıyor.

Neden “3n”?

Gemma 3n'deki "n" harfi "Yuvalanmış” modelinin kullanımını yansıtan Matruşka Transformatörü (Ya da MatFormer) mimarisi. Bu tasarım, Rus matruşka bebeklerine benzer şekilde daha büyük bir modelin içine daha küçük alt modeller yerleştirir ve yalnızca belirli bir görev için gereken bileşenlerin seçici olarak etkinleştirilmesine olanak tanır. Bunu yaparak Gemma 3n, her istekte tüm parametreleri etkinleştiren modellere kıyasla hesaplama ve enerji tüketimini önemli ölçüde azaltabilir.

Önizleme Sürümü ve Ekosistem

Google açıldı Gemma 3n önizlemesi I/O'da, Google AI Studio, Google GenAI SDK ve Hugging Face gibi platformlarda önizleme lisansı altında kullanılabilir hale getirilerek. Ağırlıklar henüz tamamen açık kaynaklı olmasa da, geliştiriciler tarayıcıda talimat ayarlı varyantlarla deney yapabilir veya Google'ın hızla genişlettiği API'ler aracılığıyla bunları prototiplere entegre edebilir.

Gemma 3n Nasıl Çalışır?

Gemma 3n'in mekanizmalarını anlamak, cihaz içi uygulamalar için uygunluğunu değerlendirmek açısından kritik öneme sahiptir. Burada üç temel teknik yeniliğini açıklıyoruz.

Matryoshka Trafo (MatFormer) Mimarisi

Gemma 3n'in kalbinde şu yer alır: MatFormer, aşağıdakilerden oluşan bir transformatör çeşidi iç içe alt modeller değişen boyutlarda. Hafif görevler için (örneğin, kısa istemlerle metin oluşturma) yalnızca en küçük alt model etkinleştirilir ve minimum CPU, bellek ve güç tüketir. Daha karmaşık görevler için (örneğin kod oluşturma veya çok modlu akıl yürütme) daha büyük "dış" alt modeller dinamik olarak yüklenir. Bu esneklik Gemma 3n'yi hesaplama-uyarlanabilir, talep üzerine kaynak kullanımını ölçeklendirme.

Katman Başına Yerleştirme (PLE) Önbelleğe Alma

Belleği daha da korumak için Gemma 3n şunları kullanır: PLE önbelleğe alma, nadiren kullanılan katman başına yerleştirmeleri hızlı harici veya özel depolamaya aktarır. RAM'de kalıcı olarak bulunmak yerine, bu parametreler anında getirildi çıkarım sırasında yalnızca gerektiğinde. PLE önbelleğe alma, erken testlere göre, her zaman yüklenen yerleştirmelere kıyasla en yüksek bellek ayak izini %40'a kadar azaltır.

Koşullu Parametre Yükleme

MatFormer ve PLE önbelleğe almanın ötesinde, Gemma 3n şunları destekler: koşullu parametre yüklemeGeliştiriciler, uygulamalarının hangi modaliteleri (metin, görüntü, ses) gerektirdiğini önceden tanımlayabilir; Gemma 3n daha sonra yüklemeyi atlar kullanılmayan modaliteye özgü ağırlıklar, RAM kullanımını daha da azaltır. Örneğin, yalnızca metinden oluşan bir sohbet robotu, görüntü ve ses parametrelerini tamamen hariç tutarak yükleme sürelerini düzene sokabilir ve uygulama boyutunu küçültebilir.

Performans Ölçütleri Neyi Gösteriyor?

İlk kıyaslamalar Gemma 3n'in hız, verimlilik ve doğruluk arasındaki etkileyici dengesini ortaya koyuyor.

Tek GPU Karşılaştırmaları

Gemma 3n uç cihazlar için tasarlanmış olsa da, yine de tek bir GPU'da rekabetçi bir performans sergiliyor. The Verge, Gemma 3'ün (daha büyük kuzeni) tek GPU ayarlarında LLaMA ve GPT gibi önde gelen modellerden daha iyi performans gösterdiğini ve Google'ın verimlilik ve güvenlik kontrollerindeki mühendislik becerisini sergilediğini bildirdi VergeGemma 3n için tam teknik raporlar yakında yayınlanacak olsa da, ilk testler verimlilik kazanımları olduğunu gösteriyor 20-30% Gemma 3'e kıyasla benzer donanımda.

Chatbot Arena Puanları

Chatbot Arena gibi platformlardaki bağımsız değerlendirmeler Gemma 3n'in 4 B parametreli varyantını öneriyor Mağazasından Matematiksel muhakeme ve konuşma kalitesi de dahil olmak üzere karma görevlerde GPT-4.1 Nano. KDnuggets'ın yardımcı editörü, Gemma 3n'in tutarlı, bağlam açısından zengin diyalogları sürdürme becerisine dikkat çekti 1.5 kat daha iyi Elo puanları öncekinden daha hızlı ve aynı zamanda yanıt gecikmesini neredeyse yarı yarıya azaltıyor.

Cihaz Üzerindeki Verim ve Gecikme

Modern amiral gemisi akıllı telefonlarda (örneğin Snapdragon 8 Gen 3, Apple A17), Gemma 3n şu başarıyı elde ediyor: 5–10 token/saniye yalnızca CPU çıkarımında, ölçekleme 20–30 token/saniye cihaz üzerindeki NPU'lar veya DSP'ler kullanıldığında. Bellek kullanımı yaklaşık olarak zirve yapar 2 GB Karmaşık çok modlu görevler sırasında RAM'in kullanımı, çoğu üst düzey mobil donanım bütçesine rahatlıkla uyum sağlar.

Gemma 3n Hangi Özellikleri Sunuyor?

Gemma 3n'in özellik seti ham performansın çok ötesine uzanarak gerçek dünyadaki uygulanabilirliğe odaklanıyor.

Çok Modlu Anlayış

Metin:Talimatlara göre ayarlanmış metin üretimi, özetleme, çeviri ve kod üretimi için tam destek.
Vizyon: Kare olmayan ve yüksek çözünürlüklü girdileri destekleyerek görüntüleri analiz edin ve altyazı ekleyin.
ses: Cihaz üzerinde Otomatik Konuşma Tanıma (ASR) ve 140'tan fazla dilde konuşmayı metne dönüştürme.
Video (Yakında): Google, gelecekteki Gemma 3n güncellemelerinde video girişi işleme desteğinin sağlanacağını belirtti.

Gizlilik Öncelikli ve Çevrimdışı Kullanıma Hazır

Gemma 3n, tamamen cihaz üzerinde çalışarak şunları sağlar: veriler asla kullanıcının donanımından çıkmaz, artan gizlilik endişelerini ele alıyor. Çevrimdışı hazır olma ayrıca uygulamaların düşük bağlantı ortamlarında işlevsel kalması anlamına gelir; bu da saha çalışmaları, seyahat ve güvenli kurumsal uygulamalar için kritik öneme sahiptir.

Dinamik Kaynak Kullanımı

Seçici Alt Model Aktivasyonu MatFormer aracılığıyla
Koşullu Parametre Yükleme kullanılmayan modalite ağırlıklarını atlamak
PLE Önbelleğe Alma gömülü öğeleri boşaltmak

Bu özellikler bir araya gelerek geliştiricilerin kaynak profilini kendi ihtiyaçlarına göre uyarlamalarına olanak tanır; bu, pil açısından hassas uygulamalar için minimum alan kullanımı veya multimedya görevleri için tam özellikli dağıtım anlamına gelebilir.

Çok Dilli Mükemmellik

Gemma 3n'in eğitim kadrosu şu şekilde: 140 konuşulan dil, özellikle Japonca, Korece, Almanca ve İspanyolca gibi yüksek etkili pazarlarda güçlü performans bildirildi. İlk testler, 2 × İngilizce olmayan görevlerde önceki cihaz üstü modellere kıyasla doğruluk iyileştirmeleri.

Güvenlik ve İçerik Filtreleme

Gemma 3n, açık veya şiddet içerikli içeriği filtrelemek için yerleşik bir görüntü güvenlik sınıflandırıcısı (ShieldGemma 2'ye benzer) içerir. Google'ın gizlilik odaklı tasarımı, bu filtrelerin yerel olarak çalışmasını sağlayarak geliştiricilere, kullanıcı tarafından oluşturulan içeriğin harici API çağrıları olmadan uyumlu kalacağına dair güven verir.

Gemma 3n'in tipik kullanım durumları nelerdir?

Gemma 3n, çok modlu yeteneği cihaz üzerindeki verimlilikle birleştirerek sektörler genelinde yeni uygulamaların önünü açıyor.

Hangi tüketici uygulamaları en fazla faydayı sağlar?

Kamera Destekli Asistanlar: Bulut gecikmesi olmadan doğrudan cihaz üzerinde gerçek zamanlı sahne açıklaması veya çevirisi.
Ses Öncelikli Arayüzler: Arabalarda veya akıllı ev cihazlarında özel, çevrimdışı konuşma asistanları.
Artırılmış Gerçeklik (AR): AR gözlüklerde canlı nesne tanıma ve altyazı yerleşimi.

Gemma 3n kurumsal senaryolarda nasıl kullanılır?

Saha Denetimi: Mobil cihazlarda görüntü-metin mantığından yararlanarak kamu hizmetleri ve altyapı için çevrimdışı denetim araçları.
Güvenli Belge İşleme: Finans veya sağlık sektörlerinde hassas belge analizi için şirket içi yapay zeka, verilerin cihazdan asla çıkmamasını sağlar.
Dilde Destek:Uluslararası yazışmaların gerçek zamanlı olarak anında tercümesi ve özeti.

Sınırlamalar ve dikkat edilmesi gereken noktalar nelerdir?

Bu, büyük bir ileri adım olmakla birlikte, geliştiricilerin mevcut kısıtlamaların farkında olması gerekir.

Hangi takaslar var?

Kalite ve Hız: Düşük parametreli alt modeller daha hızlı yanıt sunar ancak çıkış doğruluğu biraz azalır; doğru karışımın seçimi uygulama ihtiyaçlarına bağlıdır.
Bağlam Penceresi Yönetimi: 128 K token önemli bir miktar olsa da, daha uzun diyaloglar veya kapsamlı belge işleme gerektiren uygulamalar yine de bulut tabanlı modelleri gerektirebilir.
Donanım Uyumluluğu:NPU'ları veya modern GPU'ları olmayan eski aygıtlar daha yavaş çıkarımlar yaşayabilir ve bu da gerçek zamanlı kullanım durumlarını sınırlayabilir.

Peki ya sorumlu yapay zeka?

Google'ın duyurusuna, önyargı değerlendirmelerini, güvenlik önlemlerini ve zararı en aza indirmek ve etik dağıtımı sağlamak için önerilen kullanım yönergelerini ayrıntılarıyla açıklayan model kartları eşlik ediyor.

Sonuç

Gemma 3n yeni bir dönemin habercisi cihazda üretken AI, son teknoloji trafo yeniliklerini gerçek dünya dağıtım optimizasyonlarıyla birleştiriyor. MatFormer mimari, PLE önbelleğe alma, ve koşullu parametre yükleme amiral gemisi telefonlardan gömülü uç cihazlara kadar uzanan donanımlarda yüksek kaliteli çıkarımların kilidini açın. Çok modlu yetenekler, sağlam gizlilik korumaları ve güçlü erken kıyaslamalarla—artı Google AI Studio, SDK'lar ve Hugging Face aracılığıyla kolay erişimle—Gemma 3n, geliştiricileri kullanıcıların olduğu her yerde AI destekli deneyimleri yeniden hayal etmeye davet ediyor.

İster seyahate hazır bir dil asistanı, ister çevrimdışı öncelikli bir fotoğraf altyazı aracı veya özel bir kurumsal sohbet robotu oluşturuyor olun, Gemma 3n gizlilikten ödün vermeden ihtiyacınız olan performansı ve esnekliği sunar. Google önizleme programını genişletmeye ve video anlama gibi özellikler eklemeye devam ederken, Gemma 3n'in bir sonraki AI projeniz için potansiyelini keşfetmek için şimdi mükemmel bir zaman.

Başlamak

CometAPI, Gemini ailesi dahil yüzlerce AI modelini tutarlı bir uç noktada toplayan birleşik bir REST arayüzü sunar; yerleşik API anahtarı yönetimi, kullanım kotaları ve faturalama panoları ile. Birden fazla satıcı URL'si ve kimlik bilgilerini bir arada yürütmek yerine.

Geliştiriciler erişebilir Gemini 2.5 Flash Ön API (model:gemini-2.5-flash-preview-05-20) Ve Gemini 2.5 Pro API (model:gemini-2.5-pro-preview-05-06)vb. aracılığıyla Kuyrukluyıldız API'siBaşlamak için, modelin yeteneklerini keşfedin Oyun Alanı ve danışın API kılavuzu Ayrıntılı talimatlar için. Erişimden önce, lütfen CometAPI'ye giriş yaptığınızdan ve API anahtarını edindiğinizden emin olun.