ABD Ulusal Standartlar ve Teknoloji Enstitüsü (NIST), Center for AI Standards and Innovation (CAISI) biriminin açık ağırlıklı DeepSeek V4 Pro modelini değerlendirdiğini duyurdu.
NIST, değerlendirme çalışmalarının amaçlarından birinin, yapay zekâ sistemlerinin güvenlik ve risk profillerine dair ölçülebilir teknik içgörüler üretmek olduğunu belirtti.
Açık ağırlıklı (open-weights) modeller, araştırma ve inovasyon açısından erişilebilirliği artırırken, aynı zamanda kötüye kullanım risklerinin yönetilmesi ihtiyacını da büyütüyor. Bu nedenle standartlar ve test yaklaşımları giderek daha fazla önem kazanıyor.
CAISI’nin değerlendirmeleri, tek bir modele yönelik bir hüküm vermekten ziyade, test yöntemleri, ölçüm metrikleri ve hangi risk alanlarının nasıl ele alınabileceği üzerine odaklanıyor.
NIST, standartlaştırılmış değerlendirme çerçevelerinin, farklı modellerin karşılaştırılabilirliğini artırarak hem kamu kurumlarının hem de özel sektörün risk yönetimini kolaylaştırabileceği görüşünde.
Bu tür teknik değerlendirmeler, düzenleyici tartışmaların “soyut” düzeyden daha ölçülebilir bir zemine kaymasına katkı verebiliyor. Özellikle yüksek etkili kullanım senaryolarında güvenlik ve sağlamlık (robustness) ölçümleri belirleyici hale gelebiliyor.
NIST’in duyurusu, ABD’de yapay zekâ standartları ve test kapasitesinin kurumsallaştırılması yönündeki daha geniş çabanın bir parçası olarak görülüyor.
Önümüzdeki dönemde, benzer değerlendirmelerin farklı model aileleri ve farklı risk senaryoları için devam etmesi bekleniyor.






