
Yayınlanma: 20 Kasım 2025 09:58
Güncellenme: 20 Kasım 2025 15:04
Yapay zekâ alanında ilk kez gerçek para ile yapılan büyük ölçekli bir karşılaştırmalı performans testi düzenlendi. Nof1 tarafından hayata geçirilen Alpha Arena adlı deneyde, dünyanın önde gelen yapay zekâ modellerine gerçek piyasada kullanmaları için 10.000 dolar sermaye verildi. Amaç, hangi yapay zekânın finansal verileri en doğru yorumlayıp sermayeyi en hızlı şekilde büyütebileceğini görmekti.
Yarışmaya; DeepSeek, Qwen AI, ChatGPT (GPT-5), Grok, Claude ve Gemini gibi en üst seviye modeller katıldı. Her model, kendi stratejisini geliştirerek gerçek zamanlı piyasa koşullarına göre işlem yaptı.
Deneyin ilk sonuçları dikkat çekici bir tablo ortaya koydu:
DeepSeek Chat V3.1 → +47% getiri
Qwen3 Max → +34% getiri
İki Çin modeli de sermayelerini kısa sürede artırarak yarışın zirvesine yerleşti. Bu durum, Çin merkezli modellerin risk iştahı, veri yorumlama biçimi ve işlem agresifliği konusunda Batılı rakiplerinden farklı bir yaklaşım benimsediğini gösteriyor.
Yatırımın Yeni Adı Paratron ile Siz de Kazanmaya Başlayın!
Aynı testte Batı menşeli modellerin performansı oldukça geride kaldı:
GPT-5 (ChatGPT) → Portföyün büyük kısmı eridi.
Gemini 2.5 Pro → Benzer şekilde ciddi değer kaybı
Claude 3.7 → Daha temkinli yaklaşmasına rağmen düşük getiri
Bu sonuçlar, her modelin piyasa sinyallerini algılama biçiminin tamamen farklı olduğunu ve gerçek para söz konusu olduğunda yapay zekâların davranışlarının ciddi şekilde ayrıştığını ortaya koydu.
Deney, birkaç kritik noktayı gözler önüne serdi:
Risk yönetimi, modeller arasında tamamen farklı
Bazı yapay zekâlar hızlı kazanç için agresif strateji benimserken, bazıları daha muhafazakâr davranıyor.
Market gürültüsü, zamanlama, volatilite — modellerin tepki mekanizmalarını ciddi şekilde etkiliyor.
“Kağıt üzerinde güçlü” modeller, gerçek sermayede aynı başarıyı gösteremeyebiliyor.
Sonuç olarak finansal alanda yapay zekâ model performansının yalnızca teknik kapasiteye değil, davranışsal algoritmalara da bağlı olduğu netleşiyor.