Yapay zekanın telif hakkı sorununa dev çözüm: 8 terabaytlık yasal veri seti yayınlandı

‘The Common Pile v0.1’: Yapay Zeka Eğitiminde Yeni Bir Dönem

Yapay zeka modellerini eğitmek için EleutherAI tarafından yayınlanan 8 terabaytlık ‘The Common Pile v0.1’ adlı veri seti, lisanslı ve kamuya açık metinlerden oluşuyor. Bu veri seti, yapay zeka alanında önemli bir dönüm noktası olabilir.

EleutherAI, büyük yapay zeka şirketlerinin telif hakkı davalarıyla karşı karşıya kalmaması adına ‘The Common Pile v0.1’ veri setini geliştirdi. Bu veri seti, Hugging Face ve GitHub platformlarından indirilebilirken, içeriğinde 300.000 kamuya açık kitabın dijitalleştirilmiş verileri bulunuyor.

Yönetici direktör Stella Biderman, telif hakkı davalarının şirketlerin şeffaflığını azalttığını ve yapay zeka araştırmalarına zarar verdiğini belirtti. Bu nedenle EleutherAI, lisanslı verilerle geliştirilen Comma v0.1-1T ve Comma v0.1-2T adlı iki yeni yapay zeka modeli oluşturarak veri setinin etkinliğini kanıtladı.

EleutherAI’nin geliştirdiği bu modeller, telifli verilerle eğitilen popüler yapay zeka modelleriyle başarılı bir rekabet sergiliyor. Biderman, yasal kaynaklarla yüksek kaliteli yapay zeka modelleri geliştirilebileceğini vurgulayarak, lisanssız metinlerin performansı artırdığı yönündeki yaygın kanının haksız olduğunu belirtiyor.

Related Posts

Muşlu yüzücüler Türkiye finallerine yükseldi

Muş Gençlik ve Spor İl Müdürlüğüne bağlı yüzme takımı sporcuları, 31 Mayıs-1 Haziran 2025 tarihleri arasında Elazığ’da düzenlenen 10-12 Yaş Ulusal Gelişim Ligi 2. Etap ve 13 Yaş Baraj Geçme Müsabakalarında büyük başarı göstererek Türkiye finallerine katılma hakkı elde etti.

Elden Ring Nightreign çıktı! İlk gün yapılan yorumlar nasıl?

Elden Ring Nightreign 30 Mayıs’ta çıkışının hemen ardından beklentileri pek de karşılayamadı.

WhatsApp’a yeni buton geliyor: Artık uygulamayı silmeye gerek yok

WhatsApp, mobil kullanıcıların uygulamadan çıkış sürecini kolaylaştıracak yeni bir özellikle gündemde. Yeni çıkış butonu, kullanıcı deneyimini kökten değiştirebilir.

20 bin dolarlık insansı ev robotu piyasaya çıkmaya hazırlanıyor

UBTech’in Çin’in yaşlanan nüfusunu hedef alan 20 bin dolarlık insansı robotu, Tesla’nın en büyük rakibi olarak gösteriliyor.

Apple tüm işletim sistemlerinin tasarımını değiştiriyor

Apple, 9 Haziran Pazartesi günü Türkiye saatiyle 20.00’de başlayacak olan WWDC 2025 etkinliğinde kapsamlı duyurulara hazırlanıyor. Apple analisti Mark Gurman’a göre, bu yıl Apple’ın sadece iOS ve macOS değil, aynı zamanda watchOS, tvOS ve visionOS için de büyük tasarım değişiklikleri planladığı bildirildi.

GTA 6’daki hata gündem oldu: ‘Oynanamaz halde’ dendi

GTA 6 hayranları, yayınlanan ikinci fragmanda fark ettikleri hata nedeniyle oyunu “Oynanamaz halde” olarak değerlendirdi.