NIST: CAISI, açık ağırlıklı DeepSeek V4 Pro modelini değerlendirdi

KAMU BİLDİRİMLERİ

PATH Journal Square istasyonunda asansör arızası

PATH, Journal Square istasyonunda mezzanine ile 1 ve 2 numaralı peronlar arasındaki asansörün geçici olarak hizmet dışı olduğunu duyurdu.

Coney Island Beach çevresinde 24 Temmuz havai fişek bildirimi

Notify NYC, 24 Temmuz'da Brooklyn'de Coney Island Beach çevresinde havai fişek gösterisi planlandığını duyurdu.

Queens’te 24 Temmuz’da simülasyonlu medya prodüksiyonu

Notify NYC, 24 Temmuz'da Queens'te Greenpoint Avenue ve Railroad Avenue çevresinde simülasyonlu medya prodüksiyonu yapılacağını duyurdu.

Manhattan 10065 için Con Edison steam shutdown bildirimi

Notify NYC, Manhattan 10065 ZIP kodundaki Con Edison steam müşterileri için önleyici steam shutdown uygulandığını duyurdu.

NYC Parks bazı havuzları geçici olarak kapattı

Notify NYC, Abe Lincoln Mini Pool, Wagner Wading Pool, Crotona Pool, Mapes Pool ve Highbridge Pool'un geçici olarak kapalı olduğunu duyurdu.

ABD Ulusal Standartlar ve Teknoloji Enstitüsü (NIST), Center for AI Standards and Innovation (CAISI) biriminin açık ağırlıklı DeepSeek V4 Pro modelini değerlendirdiğini duyurdu.

NIST, değerlendirme çalışmalarının amaçlarından birinin, yapay zekâ sistemlerinin güvenlik ve risk profillerine dair ölçülebilir teknik içgörüler üretmek olduğunu belirtti.

Açık ağırlıklı (open-weights) modeller, araştırma ve inovasyon açısından erişilebilirliği artırırken, aynı zamanda kötüye kullanım risklerinin yönetilmesi ihtiyacını da büyütüyor. Bu nedenle standartlar ve test yaklaşımları giderek daha fazla önem kazanıyor.

CAISI’nin değerlendirmeleri, tek bir modele yönelik bir hüküm vermekten ziyade, test yöntemleri, ölçüm metrikleri ve hangi risk alanlarının nasıl ele alınabileceği üzerine odaklanıyor.

NIST, standartlaştırılmış değerlendirme çerçevelerinin, farklı modellerin karşılaştırılabilirliğini artırarak hem kamu kurumlarının hem de özel sektörün risk yönetimini kolaylaştırabileceği görüşünde.

Bu tür teknik değerlendirmeler, düzenleyici tartışmaların “soyut” düzeyden daha ölçülebilir bir zemine kaymasına katkı verebiliyor. Özellikle yüksek etkili kullanım senaryolarında güvenlik ve sağlamlık (robustness) ölçümleri belirleyici hale gelebiliyor.

NIST’in duyurusu, ABD’de yapay zekâ standartları ve test kapasitesinin kurumsallaştırılması yönündeki daha geniş çabanın bir parçası olarak görülüyor.

Önümüzdeki dönemde, benzer değerlendirmelerin farklı model aileleri ve farklı risk senaryoları için devam etmesi bekleniyor.

NIST: CAISI, açık ağırlıklı DeepSeek V4 Pro modelini değerlendirdi

Kurumsal