
Çinli teknoloji devi Alibaba’dan dikkat çeken bir hamle geldi. Şirket, GPT-5, Gemini 2.5 Pro ve Claude Opus 4 ile doğrudan rekabet edecek yeni üretken yapay zekâ modeli “Qwen3-Max”i duyurdu. 36 trilyon token üzerine eğitilen ve 1 trilyonun üzerinde parametreye ev sahipliği yapan Qwen3-Max, girdiği performans testlerinde verdiği yüksek puanlarla tüketicileri mest edecek gibi görünüyor.
Qwen3-Max’in öne çıkan özelliği yüksek performansı değil. Bu yapay zekâ modeli, PAI-FlashMoE isimli bir strateji ile eğitildi. Bu da verimliliği artırdı. Şirketin açıklamasına göre yeni model, Qwen2.5-Max-Base’e kıyasla yüzde 30 daha verimli eğitildi. Ayrıca eğitim süresi de hızlanmış oldu. SanityCheck ve EasyCheckpoint isimli teknolojilerle kesinti süresini beşte birine düşüren Alibaba, tüm bunları bir araya getirerek daha iyi mantık, daha doğru matematik, daha güçlü bilimsel akıl yürütme ve genel olarak daha güvenilir bir sistem oluşturdu.
Gelelim performans testlerine:
Alibaba’nın yeni yapay zekâ modeli, üretken yapay zekâların genel sıralamalarını ortaya koyan LMArena’nın 3. sırasına yerleşti. Yani Gemini 2.5 Pro ve Claude Opus 4’ten sonraki en iyi modeli konuşuyoruz. Programlama kategorisinde bir test olan SWE-Bench Verified’a giren Qwen3-Max, 69,6 puanla DeepSeek V3.1’i geride bıraktı. Modellerin API’leri ve harici araçları ne kadar iyi kullanabildiğini ölçen Tau2-Bench testine de giren Qwen3-Max, 74,8 puan ile hem Claude Opus 4’ü hem de DeepSeek V3.1’i geride bıraktı.
Alibaba, Qwen3-Max’i Qwen’in resmî internet sitesi üzerinden ücretsiz olarak yayımlamış durumda. Bu yapay zekâya ulaşmak isteyen okurlarımız buradaki bağlantıyı kullanabilirler. Geliştiriciler ise Alibaba Cloud bünyesindeki Model Studio aracılığıyla bir API olarak Qwen3-Max’e erişim sağlayabilirler.