"Enter"a basıp içeriğe geçin

Açık Kaynak Yazılımdan Açık Yapay Zekâya

Richard Stallman’ın 40 yıl önce, 27 Eylül 1983’te, gönderdiği bir e-posta tarihin akışını değiştirdi. Stallman, e-posta’da GNU (Gnu’s Not Unix – GNU, Unix Değildir) adlı bir işletim sistemi geliştireceğini ve GNU’yu onu kullanabilen herkese bedava (free) olarak vereceğini yazıyordu. Daha sonra Stallman niyetini özensiz bir şekilde ifade ettiğini belirtecekti:

Kastedilen hiç kimsenin GNU sistemini kullanma izni için ödeme yapmak zorunda olmamasıydı. Ancak buradaki kelimeler bu konuda açık değil ve insanlar onları GNU’nun kopyaları her zaman ücretsiz veya düşük bir ücretle dağıtılmalıdır şeklinde yorumluyor. Bu hiç bir zaman niyetim değildi. Sonradan özgürlük anlamındaki “free” ile ücretsiz anlamında “free” arasında dikkatli bir ayrım yapmayı öğrendim. Özgür yazılım, kullanıcılarının dağıtma ve değiştirme özgürlüğüne sahip olduğu yazılımdır. Bazı kullanıcılar kopyalarını ücretsiz edinirken, bazıları ücret öderler—ve para yazılımın geliştirilmesine destek olursa çok daha iyi olur. Buradaki önemli nokta, kopyaya sahip olan herkesin, onu kullanan diğer herkesle iş birliği özgürlüğüne sahip olmasıdır.

Stallman GNU’yu yazma gerekçesini açıklarken ise etik değerleri öne çıkarıyordu:

…bir programı beğendiğimde, programı beğenen diğer insanlarla paylaşmam gerektirdiğini düşünüyorum. Ben vicdanı rahat biçimde bir gizlilik sözleşmesi veya bir yazılım lisans sözleşmesi imzalayamıyorum. İlkeleri ihlal etmeden bilgisayarları kullanmaya devam edebilmem için, özgür olmayan herhangi bir yazılım olmadan idare edebilmem için yeterli bir özgür yazılım gövdesi oluşturmaya karar verdim.

Her şey Stallman’ın istediği gibi gitmedi. Ama yine de GNU (https://www.gnu.org/) projesinin başarılı olduğunu internetin neredeyse GNU’nın boynuzları (Resim1) üzerinde döndüğünü söyleyebiliriz.

Stallman’ın öne çıkardığı değerler önemlidir. Fakat özgür yazılımı anlamak için yazılımı bir üretim aracı olarak kavramsallaştırmanın daha yararlı olacağını düşünüyorum. Yazılım, kendi dışındaki amaçlar için bir araçtır. Yazılımlar aracılığıyla bilgisayarımızda yazı yazar, telefonda sohbet eder veya akıllı ses asistanlarıyla konuşuruz. Bu yazılımların bazılarını ücretli, bazılarını ücretsiz kullanırız. Bazılarının bedelini ise çalınan dikkatimiz veya kişisel verilerimizle öderiz. Özgür yazılım hareketinin özellikle üzerinde durduğu ise kendisi için bir araç olarak yazılımdır. Kendisi için yazılımın iki ön koşulu vardır:

1. Yazılımın kaynak koduna sahip olmak,

2. Kaynak kodunu yeniden düzenleyerek ve dolayısıyla yazılımı yeniden üretebilecek yetkinlikte olmak,

Özgür yazılım hareketi ilk koşul üzerinde durur. Burada “sahip olmak” ifadesi üzerinde özellikle durmak gerekir. Stallman, yazılımı mülkiyet ilişkileri bağlamında tartışmaktan kaçınır. Kuşkusuz bunda ABD’nin özgün koşullarının payı büyüktür. Ama mülkiyet ilişkilerini tartışmadan ne geçmişi ne de bugünü (başta açık veri ve açık yapay zekâyı) tam olarak anlayabiliriz. “A, x’in sahibidir” yetersiz bir ifadedir. A, hangi koşullarda x’in sahibidir? A’nın x üzerinde B’ye (söz konusu nesneye erişebilen diğer kişiler) karşı hakları ve bu hakların sınırları nelerdir? B’nin x üzerinde hakları var mıdır?

Örneğin, A geliştirdiği bir yazılımı veya yazılıma ait kodu internette paylaştığında telif hakları çerçevesinde A’nın ve B’nin bazı hakları vardır. Dolayısıyla A, yazılımının belirli koşullar altında paylaşılabileceğini belirten bir lisans eklemediği sürece A ve B telif haklarına göre bazı haklara ve sınırlamalara tabi olmaya devam eder. Normal şartlar altında B’nin ne Stallman’ın istediği gibi yazılımı diğer insanlarla paylaşma ne de yazılımı değiştirip/yeniden üretip dağıtma hakkı vardır. Fakat Stallman, telif haklarından yararlanarak telif haklarını tersine çevirir (copyright’tan copyleft’e).

A tarafından geliştirilen x normal şartlarda telif hakları ile korunur. A, x’i bir özgür yazılım lisansı ile lisansladığında telif haklarının kendisine verdiği hakkı B’ye dört temel özgürlüğü vermek için kullanır. Buna göre B,

1. Yazılımı herhangi bir amaç için çalıştırma özgürlüğüne sahiptir,

2. İhtiyaçlarına uygun olacak şekilde programı değiştirme özgürlüğüne sahiptir (Bu özgürlüğü, uygulamada etkin hale getirmek için, kaynak koduna erişebilmelidir. Çünkü kaynak kodu olmaksızın bir programda değişiklikler yapmak aşırı zordur).

3. Kopyaları ücretsiz olarak ya da belirli bir ücret karşılığında yeniden dağıtma özgürlüğüne sahiptir.

4. Toplumun gelişmelerden faydalanmasını sağlamak için, programın değiştirilmiş sürümlerini dağıtma özgürlüğüne sahiptir.

Böylece B, A’nın geliştirdiği bir yazılımın kaynak koduna sahip olduğu için x’in daha gelişmiş versiyonları için sıfırdan bir yazılım geliştirmez. Daha önce A’nın geliştirdiği x’in kaynak kodundan yararlanarak yazılıma yeni özellikler ekleyebilir ve x 2.0’ı geliştirebilir ya da A’dan farklı bir vizyon ve tercihlere sahipse y yazılımını geliştirmeye başlayabilir. Yani var olan kaynak daha ileri sürümler ve farklı yazılımların geliştirilmesini sağlayan/kolaylaştıran bir araç haline gelir. Ancak A’nın tüm bu özgürlükleri sunarken bir şartı vardır: B, x 2.0’ı (ya da y’yi) satarken veya dağıtırken bu özgürlükleri korumalıdır. Bir diğer deyişle x 2.0 da özgür yazılım olmalıdır. Bu zorunluluk, özgür yazılımı geliştirenlerin emeklerini korur. Özgür yazılımcıların geliştirdikleri yazılımlar kendilerinin karşısına yabancı bir güç olarak çıkmaz. Şirketler elbette özgür yazılımdan para kazanabilir, ama bu yazılımın kaynak kodunu gizleyerek ve geliştiricilerin üretim özgürlüğünü sınırlayarak olmayacaktır. Kaynak kodunun paylaşımı veya yazılım geliştiricilerin gönüllü olarak yazılım projelerine katkıları özgür yazılımla başlamadı. Ancak daha önce şirketler bu gönüllü katkıları alarak ve karşılığında hiçbir şey vermeyerek özel mülkiyetli yazılımlar geliştirebiliyorlardı. Özgür yazılım lisansı GNU GPL (GNU Genel Kamu Lisansı), şirketlerin özgür yazılımlardan yararlanmasını engellemez ama yazılımı özel mülkiyeti yapmasını olanaksızlaştırır.

Açık Kaynak Yazılım Hareketi ise başta Stallman olmak üzere Özgür Yazılım Hareketi’nin sözcülerinin etik değerlere yaptığı vurgudan duyulan rahatsızlıktan ortaya çıkar. Açık kaynak yazılımın ve açık kaynak yazılım geliştirme süreçlerinin teknik üstünlüklerini öne çıkarmayı tercih ederler. Bu bağlamda, özellikle açık kaynaklı yazılımların popülerliğini artırmayı ve iş dünyasını açık kaynaklı yazılımlara yaklaştırmayı hedeflerler. Ancak asıl değişiklik yazılım lisanslarına yaklaşımdadır. Özgür Yazılım Hareketi için özgürlüğün sürekliliği ve geliştiricilerin emeğinin ürünlerine el konulamaması olmazsa olmazdır. Ama bazı açık kaynak lisansları iş dünyasını cezbetmek adına daha özgürlükçü (!) davranır ve şirketlere, yazılımı kaynak kodu olmadan satma hakkı verir.

Stallman, Özgür Yazılım Hareketi ve Açık Kaynak Hareketi’ni özgür yazılım topluluğundaki iki politik kampa benzetiyordu. 1960’lardaki radikal gruplar aynı hedefe sahip olmalarına rağmen stratejilerde anlaşamıyorlardı. Özgür Yazılım Hareketi ve Açık Kaynak Hareketi’nde ise tam tersi bir durum vardı. İki hareketin de hedefleri farklıydı. Temel ilkeler konusunda uyuşamasalar da pratik önerilerde az çok fikir birliği vardı. Stallman, Açık Kaynak Hareketi’ni bir düşman olarak görmediğini asıl düşmanın özel mülkiyetli yazılım olduğunun altını çiziyordu. Ama iki hareketin önem verdiği noktalar farklıydı. Özgür Yazılım Hareketi geliştiricilerin üretme özgürlüğünü ön plana koyan ve üretim odaklı bir çizgi izliyordu. FSFE’nin (Free Software Foundation Europe – Avrupa Özgür Yazılım Vakfı) “Halkın parası, halkın kodu” kampanyası bunun en güzel örneklerinden biriydi. Açık Kaynak Hareketi ise daha çok belirli özel mülkiyetli yazılımlara karşı açık kaynaklı muadillerini kullandırmayı hedefliyordu.

Fakat bugün, Açık Kaynak Yazılım Hareketi hakkında Stallman kadar olumlu olmadığımı belirtmek isterim. Yukarıda da vurguladığım gibi özgür yazılımda asıl vurgu üretim özgürlüğüydü. Yazılımın kaynak koduna erişim ve onu değiştirme hakkı üretim özgürlüğü için gerekli bir ön koşuldu. Bu nedenle Özgür Yazılım Hareketi, yazılım patentleri ve DRM (Digital Rights Management – Sayısal Haklar Yönetimi) gibi sorunlarda uzlaşmaz bir tavır sergiliyordu. Buna karşın Açık Kaynak Hareketi’nde yazılımın kaynak kodu fetişleştirildi; kaynak kodunun niçin gerekli olduğu kimi zaman unutuldu. Bugün açık YZ hakkındaki tartışmalar ve açık YZ’ye yüklenen misyonlarda bu fetişleştirmenin izlerini görebiliyoruz.

Aslında en başından beri açık kaynak yazılım, teknoloji firmaları tarafından araçsallaştırıldı ve şirketler, açık kaynak projelerini çeşitli biçimlerde kendi yararlarına kullandılar:

1. İş modelleri özel mülkiyetli yazılıma dayanan rakiplerine karşı açık kaynağa yatırım yaptılar. 1999 yılında IBM, Microsoft’un pazar hakimiyetini engellemek için GNU/Linux’a 1 milyar dolar yatırım yaptı.

2. Platformları kontrol etmek için açık kaynağa dayalı bir strateji uyguladılar. 2005 yılında Android’i satın alan Google, 2007 yılında Android işletim sistemini açık kaynak kodlu bir yazılım olarak piyasaya sürdü. Bu hamleyle Google mobil pazarda bir dizi avantaj elde etti ve Apple’a alternatif oldu. Google, Android işletim sistemini açık bir şekilde yayınlayarak ve geniş geliştirme çerçeveleri, teşvikler ve destekler sağlayarak, zamanlarını Android için uygulamalar oluşturmaya ve sürdürmeye adayan geliştiricilerin ilgisini çekmeyi başardı. Böylece işletim sistemini, bu uygulamaları kullanmak isteyen tüketiciler için daha cazip hale getirerek Android kullanımını özendirdi. Ancak Google’ın Android işletim sistemini açık kaynak lisansı altında sunma kararı, uygulama katmanında benimsenmeyi ve rekabeti teşvik ederken, işletim sistemi geliştirmeye giriş engellerini ortadan kaldırmadı. Google, platformun asıl sahibi olarak bir yandan geliştiricilerin katkılarını alırken diğer yandan platform üzerindeki belirleyici gücünü devam ettirdi. Bunun sonucunda “mobil rekabeti ve tüketici tercihlerini kısıtladığı” gerekçesiyle Avrupa Komisyonu tarafından 4,3 milyar dolar para cezasına çarptırıldı.

3. Stallman’ın üzerinde durduğu özgür yazılım lisansları, geliştiricilerin emeğine el konulmasını engelliyordu. Bazı açık kaynak lisansları ise topluluğun emeğine el konulmasının önünü açıyordu. Amazon, 2019 yılında popüler açık kaynak veritabanı MongoDB’nin kendi versiyonunu hayata geçirdi ve ardından bunu AWS platformunda bir hizmet olarak satmaya başladı. MongoDB’nin CEO’sunun belirttiği gibi açık kaynaklı bir proje ilginç veya popüler hale geldiğinde, bulut satıcıları tüm değere el koyup ve topluluğa hiçbir şey vermeyebiliyordu. Bu nedenle MongoDB, farklı bir açık kaynak lisansa yönelme kararı aldı. İşin ilginci Stallman GNU GPL ile bu gibi durumların önüne geçmek istemişti!

4. Meta, PyTorch adlı çerçeve yazılımı, açık kaynak kullanımının dışarıdan ve ücretsiz olarak geliştirilen yeni fikirlerden yararlanmanın bir aracı haline getirilmesine iyi bir örnekti. PyTorch’un kolay erişilebilir geliştirme araçları kütüphanesi, fiili bir standart haline geldi. Sonuç olarak Meta, yeni modelleri ve diğer yenilikleri, çoğu durumda bunların geliştirilmesi için ödeme yapmadan veya doğrudan yönetmeden, kâr amacıyla ürünlerine kolayca entegre edebilme olanağına kavuştu.

Açık Kaynak Yapay Zekâ

Özgür yazılım ve açık kaynak yazılımın aksine açık veya açık kaynak YZ’nin tanımı oldukça belirsiz. OSI (Açık Kaynak Girişimi – Open Source Initiative), kısa bir süre önce açık kaynak olarak nitelendirilebilecek yapay öğrenme sistemlerini tanımlamak için çok paydaşlı bir süreç başlattı. Kâr amacı gütmeyen kuruluşlar, şirketler ve araştırma gruplarından insanlar açık kaynak değerlerini yansıtan YZ sistemlerinin nasıl tanımlanabileceği üzerine durdular. Böylece politika yapıcıların kafa karışıklığını azaltmayı, geliştiricilerin veri paylaşımı ve şeffaflığı anlamalarına yardımcı olmayı, açık yıkamayla (şirketlerin açıklık söylemiyle kendi çıkarlarını meşrulaştırma çabalarını) mücadele etmeyi hedefliyorlar.

OSI öncülüğünde yürütülen tartışmada açık YZ hakkında farklı görüşler olmasına karşın teknoloji endüstrisi tarihinin çok farklı bir döneminde yazılımlara uygulanmak üzere yazılan geleneksel açık kaynak tanımının YZ’yi kapsamadığı hakkında bir mutabakat var (https://blog.opensource.org/towards-a-definition-of-open-artificial-intelligence-first-meeting-recap/ ). Ama bu mutabakat, şirketlerin sık sık ürünlerini açık ya da açık kaynaklı olarak sunmasını engellemiyor. Widder, West ve Whittaker’ın (2023) belirttiği gibi şirketler onlarca yıl önce geleneksel yazılım bağlamında oluşturulan açık kaynakla ilgili ideoloji ve varsayımları açık YZ ile eşleştiriyorlar.

Düzenleme ve yönetişim hakkındaki tartışmalarda açık veya açık kaynaklı YZ sistemlerinin varlığı, YZ’den elde edilen faydaların ve bu tür sistemleri oluşturmak için gereken kaynakların büyük teknoloji şirketleri dışındakiler tarafından da kolayca erişilebilir olduğunu (veya olabileceğini) göstermek için sıklıkla kullanılıyor.

Açık ve açık kaynak, YZ bağlamında kullanıldığında aşağıdaki durumlara atıf yapabiliyor:

1. Şeffaflık: Kaynak koduna, belgelere ve verilere erişme ve bunları inceleme yeteneği.

2. Yeniden kullanılabilirlik: Üçüncü tarafların kaynak kodunu ve/veya verileri yeniden kullanmasına izin vermek için gereken yetenek ve lisanslama

3. Genişletilebilirlik: Mevcut kullanıma hazır modellerin üzerine inşa etme, bunları bir veya başka bir özel amaç için ayarlama yeteneği.

Uygulamada ise açıklık farklı biçimlerde karşımıza çıkabilir. Bir YZ modelini şekillendirmek için kullanılan eğitim ve değerlendirme veri setleri kamuya açık hale getirilebilir; bir modelin mimarisini veya hiperparametre ayarlarını tanımlayan kod, bir açık kaynak lisansı ile yayınlanabilir; bir modeldeki model ağırlıkları kamuya açık hale getirilebilir, model kartları veya veri sayfaları yayınlanabilir. Ancak açık olarak tanımlanan bazı sistemler, bir API (Application Programming Interface – Uygulama Programlama Arayüzü) ve teknolojinin ticarileştirilmesi de dahil olmak üzere yeniden kullanıma izin veren bir lisanstan biraz daha fazlasını sağlar (Widder vd, 2023). Örneğin Meta, Llama-2’yi (https://ai.meta.com/llama/) açık kaynak olarak lanse etmektedir. LLaMA-2 ücretsiz olarak indirilebilir ve model ağırlıkları mevcuttur. Fakat OSI’nin kriterlerine göre LLaMA-2’yi açık kaynaklı değildir ve Meta açık kaynağı sadece bir pazarlama jargonu olarak kullanmaktadır (https://www.theregister.com/2023/07/21/llama_is_not_open_source/).

Widder vd (2023) ise açıklığı büyük YZ sistemlerini oluşturmak ve kullanmak için gereken kaynaklar (çerçeveler, bilgi işlem, veriler, işgücü ve modeller) bağlamında inceliyor ve YZ’de açıklığın karmaşıklığını ortaya koyuyorlar.

Çerçeveler

Yazılım geliştirme çerçeveleri, yazılım geliştirenlerin onu düzenli, öngörülebilir ve amaca uygun yöntemlerle oluşturmasını ve dağıtmasını kolaylaştırır. Ortak geliştirme görevleri için önceden yazılmış kod parçaları, şablonlaştırılmış iş akışları, değerlendirme araçları ve diğer standartlaştırılmış yöntemler ve yapı taşları sağlayarak çalışırlar. Bu, daha değiştirilebilir, birlikte çalışabilir ve test edilebilir hesaplama sistemleri oluşturmaya yardımcı olurken, “tekerleği yeniden icat etmek” için harcanan zamanı en aza indirir ve sistemleri sıfırdan uygularken kolayca ortaya çıkan hataları önler.

YZ’deki çerçeveler, giderek daha geniş veri setleri, veri doğrulama araçları, değerlendirme araçları, model oluşturma araçları, model eğitimi ve dışa aktarma araçları, ön eğitim kütüphaneleri içeriyorlar; YZ’nin geliştirilmesini ve kullanımını şekillendiriyorlar. YZ geliştirme çerçevelerinin başında PyTorch ve TensorFlow geliyor. PyTorch başlangıçta Meta tarafından dahili kullanım için geliştirildi, ancak 2017’de kamuyla paylaşıldı. PyTorch, Linux Vakfı çatısı altında bir araştırma vakfı olarak faaliyet gösterse de, Meta tarafından finansal olarak desteklenmeye devam ediyor ve baş katkıda bulunan dört kişiden üçü Meta çalışanı, dördüncü kişi ise eski bir Meta çalışanı. TensorFlow ise ilk olarak 2015 yılında Google Brain tarafından geliştirilmiş ve piyasaya sürülmüş. Temel katkıda bulunanların çoğu Google tarafından istihdam ediliyor ve Google projeyi finansal olarak desteklenmeye devam ediyor.

Çerçeveler Google ve Meta’ya, araştırmacıların ve geliştiricilerin çalışma pratiklerini, kendi YZ modellerine kolayca entegre edilebilmelerine ve ticarileştirilebilmelerine olanak tanıyor. Her iki şirket de bu çerçeveler sayesinde ekosistem içinde önemli güce sahipler: Geliştiricileri, araştırmacıları ve bu araçlarla etkileşime giren öğrencileri şirketin tercih ettiği çerçevenin normlarına göre eğitiyorlar. Böylece YZ alanındaki egemenliklerini genişletebiliyorlar.

Hesaplama

Güçlü YZ modelleri geliştirirken devasa veri setlerinden yararlanılır ve bunları işlemek için büyük hesaplama gücü gerekir. Büyüyen veri setleri ve buna ayak uyduran hesaplama gereksinimleri ile ölçeklendirme yarışı günümüzdeki YZ’nin başlıca karakteristiklerinden biridir. Hesaplamaya erişim, en ileri düzeyde açık YZ sistemleri için bile yeniden kullanılabilirlik için önemli bir engeldir. Çünkü büyük ölçekli YZ modellerinde hem eğitim hem de çıkarımların kamu kullanımına açılabilmesi için bir ürün veya API’de sunulabilmesi için yüksek maliyet söz konusudur.

Ayrıca, özel donanımlardan maksimum hesaplama kapasitesi elde etmek için özel mülkiyetli yazılım sistemleri gerekebilmektedir. YZ modeli eğitiminin çoğu, Nvidia tarafından geliştirilen ve yalnızca şirketin özel mülkiyetli GPU’larında eğitimi destekleyen özel mülkiyetli bir çerçeve olan CUDA’da uygulanmaktadır. OpenAI, GPU türleri (platformlar) arasında gelecekte taşınabilirliği sağlama iddiasıyla CUDA’ya açık kaynaklı bir alternatif olarak Triton’u yarattı, ancak Triton şu anda yalnızca Nvidia’nın GPU’larında çalışıyor. OpenAI, Triton’un diğer hesaplama platformlarında çalışmasını sağlayabilecek topluluk katkılarını memnuniyetle (!) karşılasa da kendisi bunun için henüz bir yatırım yapmadı. Google’ın TensorFlow programları ise kodun doğrudan Google’ın TPU’ları (Tensor Processing Unit) üzerinde çalıştırılmasını sağlamak için yazılmış. Ayrıca TensorFlow’da, Google donanımında belirli modellerin çalışmasını hızlandırabilen XLA gibi alana özgü derleyiciler de var. YZ geliştirme için hesaplama gücünü optimize eden bazı alt düzey yazılımların kodları incelemeye açık olabilir. Ama pratikte bu yazılımlar genellikle özel mülkiyetli donanım ortamlarında verimlilik için tasarlanıyor ve hesaplama kaynakları satan ve/veya YZ modellerini lisanslayan şirketler tarafından geliştiriliyor ve yönetiliyor.

Kısacası, özgür yazılım veya açık kaynakta olduğu gibi yazılımın kaynak koduna erişimin süreci demokratikleştirici etkisi son derece sınırlı olacaktır. Çünkü yeni YZ modelleri oluşturmak ve mevcut olanları ölçekli olarak kullanmak için gereken hesaplama kaynaklarının maliyeti çok yüksektir. Hesaplama kaynakları; ölçek ekonomilerinden, hesaplamayı optimize eden yazılımı kontrol etme kapasitesinden ve hesaplama kaynaklarına pahalı erişim satma yeteneğinden yararlanan az sayıda şirketin elinde yoğunlaşmıştır.

Veri

Hesaplama gücü ve veri günümüzdeki YZ modellerinin en önemli bileşenleridir. Her birindeki artış modelin performansını da etkiler.

Modelin yararlandığı veri, yalnız performansı değil modelin çıktılarını anlamak/tahmin edebilmek ve gerekli önlemleri alabilmek için de önemlidir. Ancak piyasada bulunan mevcut nesil üretken YZ sistemlerini (GPT-4, Bard, PaLM-2) eğitmek için kullanılan veriler hakkında çok az şey biliyoruz. Özellikle Google ve OpenAI/Microsoft, PaLM-2 ve GPT-4’ü ve şekillendirmek için kullanılan eğitim verileri hakkındaki önemli bilgileri açıklamıyorlar.

Piyasada bulunan önceki nesil YZ sistemleri ve en güncel açık YZ modellerini eğitmek için kullanılan veriler hakkındaki bilgimiz biraz daha fazla. Mevcut açık YZ modelleri sıklıkla geniş kullanım için kamuya açık hale getirilen ve webin kazınmasıyla (scrap) elde edilen Common Crawl ve The Pile’daki verilere dayanır. Common Crawl veri seti, sadece büyük şirketlerin değil, herkesin yüksek kaliteli araştırma ve analiz yapabilmesini sağlayarak verileri demokratikleştirmeyi hedefleyen ABD merkezli kâr amacı gütmeyen bir kuruluştur. Common Crawl verilerine, verileri Açık Veri Sponsorlukları programı kapsamında sunucularında tutan Amazon üzerinden erişilebilir. The Pile ise YZ dil sistemleri oluşturmak için tasarlanmış açık bir veri setidir. Wikipedia, YouTube altyazıları ve HackerNews web sitesi de dahil olmak üzere 22 küçük veri kümesinin derlenmesiyle oluşturulmuştur. AB merkezli topluluk The Eye, “erişim ve araştırmayı demokratikleştirmeye yönelik ısrarlı bir çabayı desteklemek için” veri setine ev sahipliği yapıyor.

Fakat YZ modellerini eğitmek ve kalibre etmek için kullanılan verilerin hazırlanması ve iyileştirilmesi, açık bir veri setini indirmekten çok daha karmaşık bir süreçtir. Pile ve CommonCrawl gibi veri setlerinin şeffaflığı ve yeniden kullanılabilirliği, model eğitiminin ve sınırlamalarının daha iyi değerlendirilmesi için yararlıdır. Ancak eğitimde kullanmadan önce bunları düzenlemek için önemli bir emek harcanır.

Emek

Büyük ölçekli YZ sistemleri seçilmiş, etiketlenmiş, dikkatle düzenlenmiş verilere ihtiyaç duyar. Bir diğer deyişle, büyük ölçekte YZ oluşturmak için insan emeğine gerek var. Büyük ölçekli YZ sistemleri olan üretken YZ sistemleri, insan tarafından üretilen geniş bir metin, konuşma ve/veya görüntü yelpazesi üzerinde eğitilmekte ve değerlendirilmektedir. Bir modeli, saldırgan veya tehlikeli materyalleri kopyalamadan insan benzeri çıktıları taklit edebilecek biçimde şekillendirmek ve modelin çıktılarının kabul edilebilir sınırlar içinde kalmasını sağlamak için yoğun insan müdahalesi gerekir.

Google’ın Bard modeli, Accenture Plc ve Appen Ltd adlı dış kaynak firmaları tarafından işe alınan işçilere dayanıyor. OpenAI, GPT modelleri için Kenya’da Sama adlı dış kaynak firması aracılığıyla işçi kiralıyor. İşçilerin anlamlı bir destek olmaksızın düşük ücretler karşılığında korkunç metin ve görüntüleri tekrar tekrar izlemeye ve okumaya zorlanması çeşitli zararlı sonuçlara yol açıyor.

Bu emek süreçlerindeki güvencesizlik, zararlar ve sömürgeci dinamikler çoğu zaman göz ardı ediliyor. Şirketler çalışmalarında önemli bir yere sahip bu emek süreçleri hakkında çok az bilgi yayımlıyorlar. Bildiklerimiz ise büyük ölçüde araştırmacı gazeteciliğin ya da işçilerin örgütlenmesinin ürünü. Açıklık, YZ sistemlerinin tüm emek süreçlerinden açıklığı da içerir mi?

Modeller

Modeller, büyük miktarda yapılandırılmış veri kullanılarak eğitilen ve belirli bir girdiye istatistiksel olarak olası çıktılar üreten algoritmik sistemlerdir. Eğitilen YZ modeli, diğer açık kaynaklı yazılımlar gibi yeniden kullanım için yayımlanabilir. Önceden eğitilmiş bir YZ modelini yeniden kullanmak için temel eğitim veya değerlendirme verilerine erişim gerekli değildir. Kendini açık olarak etiketleyen birçok YZ sistemi aslında bundan yararlanır. Widder vd’nin (2023) vurguladığı gibi şirketler böylece anlamlı dokümantasyon ve erişim sağlamak yerine, belgelenmemiş verileri devralan, açıklamalı RLHF (Reinforcement Learning with Human Feedback – İnsan Geri Bildirimi ile Pekiştirmeli Öğrenme) eğitim verilerini gizleyen ve bulgularını nadiren yayınlayan kapalı modellerini sarmalar. Bazı şirketlerin iş modeli ise açık modellere API erişimi, özel veriler üzerinde model eğitimi ve müşterilere ücretli bir hizmet olarak güvenlik ve teknik destek gibi ekstra özellikler ve hizmetler için ücret almaya dayanır.

Sürekli artan model (ve veri ve hesaplama) ölçeği, YZ geliştirmedeki mevcut paradigmadır. Daha büyük modeller daha güçlü ve daha yoğun kaynak gerektirir ve bu nedenle büyük teknoloji şirketleri dışında üretilmesi daha zordur. Sıfırdan inşa edilen modellerde teknoloji şirketleri modeli biçimlendiren kritik kararlar verirler. Açık YZ örnekleri ise büyük teknoloji şirketleri tarafından yayımlanan modellere ince ayar yapma gibi hesaplama açısından daha az pahalı bir göreve odaklanır. Önceden eğitilmiş bir model alınır ve belirli bir bağlamda veya alanda kullanılmak üzere ince ayarlar yapılır.

***

Geçmişte olduğu gibi bugün de açıklık, şirketler tarafından konumlarını sağlamlaştırmak ve güçlendirmek için retorik bir dayanak olarak kullanılıyor. Açık kaynak YZ’nin AB YZ Yasası kapsamında zorunlu kılınan düzenlemelerden muaf tutulup tutulmayacağı konusundaki tartışmalar şirketlerin açık kaynak YZ’ye bakışı hakkında önemli ipuçları veriyor. Avrupa Parlamentosunun taslak metni oylamasından önce, bir grup kuruluş AB’nin önerdiği düzenlemenin açık kaynaklı YZ geliştiricileri için çok zahmetli olacağına dair endişelerini dile getirdi. Kâr amacı gütmeyen bir kuruluş olan LAION (Large-scale Artificial Intelligence Open Network – Büyük Ölçekli Yapay Zeka Açık Ağı) öncülüğünde yayımlanan açık mektupta düzenleyici müdahalenin inovasyonu boğacağı iddia edildi. Karşı çıktıkları düzenleme gereklilikleri arasında yüksek riskli bağlamlarda konuşlandırılan sistemler için risk değerlendirmeleri yapma ve YZ modelleri tarafından üretilen otomatik karar vermenin yeterli dokümantasyonunu ve izlenebilirliğini sağlama zorunlulukları yer alıyor. Google’ın YZ Yasası ile ilgili olarak AB’ye yaptığı sunumda şirket, Yasanın “YZ ekosisteminde açık işbirliği üzerinde caydırıcı bir etkisi” olacağını iddia ediyor. Microsoft’un GitHub CEO’su, açık kaynaklı YZ’nin “dünya çapında ve Avrupa’da bir inovasyon baharı” yarattığını savunuyor. Cisco, IBM ve Oracle’ı da temsil eden bir endüstri ticaret grubu olan Business Software Alliance, yasaya uyumun Avrupa’da açık kaynak yazılım ve YZ’nin gelişimine zarar vereceğini iddia ediyor.

Fakat şurası açık ki, açık kaynak yazılımdan açık YZ’ye, açıklık şirketlerin geliştiricilerin ve yaratıcıların emeğini sistematik olarak sömürebilmesini sağlıyor. En büyük şirketler, açıklık söylemi altında altyapı ve ekosistem hakimiyetini devam ettiriyorlar. Şeffaflık, yeniden kullanılabilirlik ve genişletilebilirlik açısından en ileri düzey açık YZ sistemlerinde bile bu tür olanaklar YZ’ye demokratik erişim ve anlamlı rekabet açısından yeterli değil. Açıklık tek başında YZ’deki gözetim ve denetimi sorununu çözmüyor.

YZ sistemleri, sağlık, finans, eğitim gibi kamusal etkiye sahip çok sayıda hassas alana entegre ediliyor. Ticari çıkarların değil halkın ihtiyaçlarının biçimlendireceği YZ ve diğer sistemlerin inşasına ihtiyacımız var. Bu nedenle, teknoloji tekellerinin tanımladığı ve hakim olduğu teknolojiye anlamlı alternatifler yaratabilmek önemli. Fakat umutlarımızı tek başına açık kaynaklı YZ’ye bağlamak bizi bu dünyaya götürmeyecektir. Hatta açık kaynak YZ, düzenleme gibi farklı seçenekleri gölgelediğinden birçok açıdan işleri çok daha kötü hale getirebilir.

Kaynaklar

Stallman, R. M. (2009). Özgür yazılım, özgür toplum. Çev. Çapkan, S., Gözükeleş, İ., Kalaycı TE, Özşar, Çİ, Sarıfakıoğlu, B., Ankara: TMMOB Elektrik Mühendisleri Odası Yayınları.

Widder, D. G., West, S., & Whittaker, M. (2023). Open (For Business): Big Tech, Concentrated Power, and the Political Economy of Open AI. Concentrated Power, and the Political Economy of Open AI

İlk Yorumu Siz Yapın

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir