Üzerine çalıştığım konularda kendimi ilerletmek için okumalar yapıyorum bugünlerde. Kitabı sevdim. Mühendislik temeli olmayan veya daha önce bu konulara hiç çalışmamış olanlar için de gayet okunabilir bir kitap olduğunu düşünüyorum. Konuyu bir bütün olarak görmeme, bazı yerleri bağdaştırmama fazlasıyla yardımcı…devamıÜzerine çalıştığım konularda kendimi ilerletmek için okumalar yapıyorum bugünlerde.
Kitabı sevdim. Mühendislik temeli olmayan veya daha önce bu konulara hiç çalışmamış olanlar için de gayet okunabilir bir kitap olduğunu düşünüyorum.
Konuyu bir bütün olarak görmeme, bazı yerleri bağdaştırmama fazlasıyla yardımcı oldu. Tam anlamıyla "tamamlanmış" bir kitap olduğunu söyleyebilirim. "Keşke buraya da şunu ekleselermiş" dediğim hiçbir yer olmadı okurken.
Kısacası, okunur. Hatta okunmalı.
Kitabı kütüphaneye geri vereceğim için bende durmasını istediğim kısımları aşağıya ekliyorum. Yazı sığmazsa yorumlarda devam edeceğim.
* Birkaç bin yıl önce, resminizin çizilmesini, heykelinizin yapılmasını veya hikayenizin hatırlanıp anlatılmasını istiyorsanız, bir tanrı veya tanrıça olmanız gerekiyordu. Bin yıl önce bir kral veya kraliçe, birkaç yüzyıl önce ise zengin bir tüccar olmanız ya da böyle birinin evinde yaşamanız gerekiyordu. Artık herkesin, hatta bir çorbanın bile resmi yapılabilir. Benzer bir demokratikleşme bilgisayar ve veride de yaşanmıştır. Bir zamanlar sadece büyük kuruluşlar ve işletmeler bilgisayarda yapılmaya layık işlere sahipti ve bu yüzden de sadece onların verileri vardı; kişisel bilgisayarla beraber insanlar ve hatta nesneler veri üreteçleri haline geldi.
* Sosyal medyayla birlikte her birimiz artık hayatı takip edilmeye değer birer ünlüyüz ve kendi kendimizin de paparazzisiyiz. Artık bize yalnızca on beş dakikalık bir ün vaat edilmiyor, çevrimiçi olduğumuz her an ünlüyüz. Sosyal medya dijital otobiyografimizi yaşarken yazmamıza izin veriyor. Eski zamanlarda kitaplar ve gazeteler pahalıydı ve dolasıyla nadir bulunurdu; yalnızca önemli hayatların izini sürüp hikayesini anlatabilirdik. Şimdiyse veri ucuz ve hepimiz küçük çevrimiçi derebeyliklerimizin kral ve kraliçeleriyiz. Bugün, aygıtlara meraklı ebeveynlere doğan bir bebek henüz ilk ayında Odysseus'un tüm maceralarını anlatmak için Homeros'un ürettiğinden daha fazla veri üretebilir.
* Makine öğrenmesi sadece bir veri tabanı veya programlama problemi değildir, aynı zamanda yapay zeka için bir gerekliliktir. Değişen bir çevrede bulunan bir sistem öğrenme yeteneğine sahip olmalıdır; aksi takdirde ona zeki dememiz pek de mümkün değildir. Sistem bu değişiklikleri öğrenip onlara uyum sağlayabiliyorsa, sistem tasarımcının olası tüm durumları öngormesi ve onlara çözüm sağlaması gerekmez.
* Beyne ilgi duyuyoruz, zira onun daha iyi bilgisayar sistemleri kurmamıza yardımcı olabileceğine inanıyoruz. Beyin görme, konuşma, tanıma ve öğrenme gibi muazzam yetenekleri olan ve çoğu alandaki mühendislik ürünlerini aşan bir bilgi işleme cihazıdır. Bu uygulamalar makinelerde kullanıldığında bariz bir ekonomik faydaya sahiptir. Beynin bu işlevleri nasıl yerine getirdiğini anlayabilirsek, bu görevlerin çözümlerini biçimsel bir algoritmalar olarak tanımlayabilir ve bunları bilgisayarlara uygulayabiliriz.
* Beyni Anlamak
Marr'a (1982) göre, bir bilgi işlem sistemini anlamak üç analiz düzeyinde gerçekleşir:
1. Hesaplama teorisi, hesaplamanın amacına ve görevin soyut bir tanımına tekabül eder.
2. Gösterim ve algoritma [representation and algorithm], girdi ile çıktının nasıl gösterildiği ve girdiden çıktıya dönüştürme algoritmasının özgülleştirilmesiyle ilgilidir.
3. Donanım uygulaması [hardware implementation], sistemin fiziksel olarak gerçekleştirilmesidir.
Bu analiz seviyelerindeki temel fikir, aynı hesaplama teorisi için, bu gösterimdeki simgeleri işleyen çok sayıda gösterim ve algoritma bulunabilmesidir. Benzer şekilde, herhangi verili bir gösterim ve algoritma için birden fazla donanım uygulaması bulunabilir. Herhangi bir teori için çeşitli algoritmalardan birini kullanabiliriz ve aynı algoritmanın farklı donanım uygulamaları olabilir.
* Sensörlerimizin çoğu mükemmel olmaktan uzaktır, daktilo kullananlar her zaman yazım hatası yaparlar ve genellikle makul ve rasyonel davrandığımıza inanmamıza rağmen fevri olarak da hareket eder ve gayriihtiyari satın alır/okur/dinler/tıklar/seyahat ederiz. İnsan davranışı bazen Apollon'cu olduğu kadar Dionysos'çudur da.
* Doğruluk derecelerini temsil etmek için bulanık üyelikler, bulanık kurallar ve çıkarımla birlikte bulanık mantık [fuzzy logic] ileri sürüldü ve başlangıçtan beri çeşitli uygulamarda bir miktar başarı sağladı (Zadeh 1965). Belirsizliği temsil etmenin bir başka yolu, bu kitapta yaptığımız gibi olasılık teorisini kullanmaktır.
Bu kitapta ele aldığımız makine öğrenmesi sistemleri, karar almada uzman sistemlerin iki şekilde genişletilmesini ifade eder; Birincisi, programlanmaları gerekmezken örneklerden öğrenebilirler ve ikincisi, olasılık teorisini kullandıkları için tüm eşlik eden gürültüsüyle, istisnalarıyla, muğlaklıklarıyla ve sonuçta ortaya çıkan belirsizlikleriyle gerçek dünya sahnelerini temsil etmede daha iyidirler.
* Max Frisch'in Homo Faber adlı romanında, yılan tarafından ısırılan bir kızın annesine endişelenmemesi söylenir, zira yılan ısırıklarından kaynaklı ölüm oranı yüzde 3 ile 10 arasındadır. Kadın sinirlenir ve, "Yüz kızım olsaydı... o zaman sadece üç ila on kızımı kaybedecektim. İnanılmaz az! Oldukça haklısınız!" der ve devam eder: "Sadece bir çocuğum var." Etik meseleler söz konusu olduğunda, beklenen değer hesaplamasını kullanırken dikkatli olmamız gerekir.
* Mühendislikte daima bir ödünleşim [trade-off] bulunur. Görevin çözülmesi zor olduğunda, onu kısıtlayarak daha etkili çözümler geliştirebiliriz. Sözgelimi, tekerlek taşıma için çok iyi bir çözümdür, ancak düz yüzeyler gerektirir ve bu nedenle yol da yapılması gerekir. Kontrollü ortam görevi kolaylaştırır. Bacaklar çeşitli zeminlerde çalışır ancak inşa edilmeleri ve kontrol edilmeleri daha zordur ve oldukça düşük ağırlıkta yük taşıyabilirler.
* Birçok farklı font vardır ve insanlar farklı elyazısı stillerine sahiplerdir. Karakterler ayrıca küçük veya büyük, eğimli, mürekkeple basılmış veya kalemle yazılmış olabilir ve bunun sonucunda birçok olası imaj aynı karaktere karşılık gelebilir. Tüm araştırmalara rağmen bugün hala bu görev için insanlar kadar isabet kaydeden bir bilgisayar programı bulunmamaktadır. Bu nedenle "captcha"lar hâlâ kullanılıyor. Bir captcha, kullanıcının bir insan olduğunu ve bilgisayar programı olmadığını kanıtlamak için yazılması gereken kelime veya sayıların bozuk imajıdır.
* Şimdi, önceden tanımlanmış bir çıktının ve dolasıyla böyle bir gözetmenin olmadığı gözetimsiz öğrenmeyi tartışacağız; burada sadece girdi verisine sahibiz. Gözetimsiz öğrenmede amaç, girdideki düzenlilikleri bulmak, normalde ne olduğunu görmektir. Girdi alanında belirli örüntülerin diğerlerinden daha sık ortaya çıktığı bir yapı vardır ve biz de genel olarak neyin gerçekleşip gerçekleşmeyeceğini görmek isteriz.
Gözetimsiz öğrenme yöntemlerinden biri, hedefin girdi öbeklerini ya da gruplarını bulmak olduğu öbeklemedir [clustering]. İstatistikte buna karışım modelleri denir.
* Bu tür uygulamaya özgü benzerlik gösterimleri aynı zamanda çekirdek fonksiyonu [kernel function] adı altında gruplanmiş gözetimli öğrenme uygulamalarında da popülerdir. Destek vektör makinesi [support vector machine] (Vapnik 1998) hem sınıflandırma hem regresyon için kullanılan bir öğrenme algoritmasıdır.
* Bir bilgisayar için rakibinin yüzünü tanımak, satranç oynamaktan çok daha zordur. Bir bilgisayarın en iyi insan oyuncudan daha iyi satranç oynayıp oynamaması, bilgisayarların daha zeki olduklarına dair bir gösterge değildir, zira insan zekâsı satranç gibi işler için evrimleşmemiştir.
* Önemli bir sorun, bir davranışın zeki olarak kabul edilebilmesi için gereken performans kriterinin ne olduğu (yani zekâyı nasıl ölçtüğümüz) ve böyle bir belirgin performans kriterinin bulunmadığı görevlerin olup olmadığıdır. Etik ve hukuki kaygıların belirli karar türlerinde rol oynadığını zaten tartışmıştık.
* Verilerden eğitilen ve otonom kararlar alan bilgisayar sistemlerimiz gittikçe çoğaldığı için, bilgisayarlara çok fazla güvenme konusunda dikkatli olmamız gerekiyor. Buradaki önemli zorunluluk, yazılım sistemlerinin geçerlenmesi ve doğrulanması yani yapmaları gereken şeyi yaptıklarından emin olunmasıdır. Bu özellikle veride eğitilmiş modeller için zor olabilir, zira eğitimde veri ve optimizasyondaki her türlü rastlantı yer alır. Bu, eğitilmiş yazılımı programlanan yazılımdan daha az öngörülebilir kılar. Diğer bir endişe kaynağı da verilerdeki genel davranışı öğrenen modellerin yetersiz temsil edilen vakalar veya aykırılıklar için iyi karar vermemesi olabilir.
* Zeka bedenlendiğinde ve sistem fiziksel eylemler gerçekleştirdiğinde, davranışın doğruluğu daha kritik mesele haline gelir ve hatta insan yaşamını tehdit edebilir. Bu endişenin gerçekleşmesi için söz konusu sistemin silahlı bir insansız hava aracı olması gerekmez. Kötü bir şekilde sürülürse, otonom bir otomobil silah haline gelir. Bu tür kaygılar devreye girdiğinde, normal beklenen değer veya faydacı yaklaşımlar geçerli değildir, tıpkı aşağıda, "tramvay problemi"nin bir versiyonunda ele alındığı gibi.
* Bazı insanlar hemen sonuçlara atlıyor ve yapay zekâ araştırmalarının bir gün bize egemen olmak için ayağa kalkacak metalik canavarlara, Dr. Frankenstein'ın yaratığının elektronik versiyonlarına yol açabileceğinden korkuyor. Bunun gerçekleşeceğinden emin değilim. Ancak bugün bile otomobillerden alım satıma kadar çeşitli uygulamalarda bizim için karar veren, bazıları verilerden eğitilmiş olan otomatik sistemlerimiz mevcut. Süper zeki makinelerin isyan etme ihtimali karşısında dehşete düşmektense, kötü programlanmış veya iyi eğitilmemiş yazılımlardan korkmak için daha fazla gerekçemiz olduğuna inanıyorum.