Etiket arşivi: zeka

Makine Öğrenmesinin Matematiği – 1 – Giriş

Motivasyon

Makine öğrenmesi, veriden otomatik olarak değerli bilgiler çıkaran algoritmalar tasarlamayla ilgilenir. Burada dikkat edilmesi gereken en önemli kelime “otomatik” tir; yani makine öğrenmesi, birçok farklı veri kümesine uygulanabilen ve anlamlı sonuçlar üreten genel amaçlı yöntemlerle ilgilenir. Makine öğrenmesinin temelinde yer alan üç ana kavram vardır: veri, model ve öğrenme.

Makine öğrenmesi doğası gereği veri odaklıdır; bu nedenle veri, makine öğrenmesinin merkezinde yer alır. Makine öğrenmesinin amacı, belirli bir alana özgü uzmanlığa fazla ihtiyaç duymadan, veriden değerli örüntüleri (pattern) çıkarmak için genel amaçlı yöntemler tasarlamaktır.

Örneğin, geniş bir doküman koleksiyonuna (örneğin, birçok kütüphanedeki kitaplar) sahip olduğumuzu düşünelim. Makine öğrenmesi yöntemleri, bu dokümanlarda yaygın olarak paylaşılan konuları otomatik olarak belirlemek için kullanılabilir.

Bu hedefe ulaşmak için, genellikle veriyi üreten sürece benzer şekilde modellenen yapılar tasarlarız. Örneğin, bir regresyon probleminde model, girdi değerlerini gerçek sayılarla ifade edilen çıktılara eşleyen bir fonksiyon tanımlar.

Mitchell’in (1997) ifadesini yorumlayarak söyleyecek olursak:
Eğer bir model, veriyi dikkate aldıktan sonra belirli bir görevdeki performansını artırıyorsa, o modelin veriden öğrendiği söylenebilir.

Burada Tom Mitchell’ın ifadesini kitabı okumayanlar için iyice detaylandıralım:

Tom Mitchell, makine öğrenmesi alanında önemli bir araştırmacıdır ve 1997’de yazdığı “Machine Learning” adlı kitabında makine öğrenmesini şu şekilde tanımlamıştır:

“Bir bilgisayar programı, belirli bir görev T üzerinde, performans ölçütü P’ye göre, deneyim E’den öğrenerek performansını artırıyorsa, o zaman programın T’yi öğrenerek geliştirdiği söylenir.”

Bu tanımın açılımını şöyle düşünebiliriz:

  • T (Görev – Task): Modelin gerçekleştirmesi gereken iş. Örneğin, bir e-postanın spam olup olmadığını belirleme, görüntüdeki nesneleri tanıma veya bir borsa tahmini yapma.
  • P (Performans Ölçütü – Performance Measure): Modelin başarısını ölçen kriter. Örneğin, bir sınıflandırma modelinde doğruluk oranı, bir regresyon modelinde hata metriği gibi.
  • E (Deneyim – Experience): Modelin eğitim verisinden elde ettiği bilgi. Yani geçmiş verilere dayalı öğrenme süreci.

Bu tanıma göre bir model, veriden öğrenmiş sayılabilmesi için belirli bir görevde (T), performans ölçütüne (P) göre, deneyim kazandıkça (E) daha iyi hale gelmelidir.

Örneğin:

  • Bir e-posta sınıflandırma modeli, spam ve normal e-postaları ayırmak için tasarlanmış olsun (T).
  • Modelin başarısı, doğru tahmin oranı ile ölçülüyor olsun (P).
  • Eğer model, daha fazla e-posta örneği ile eğitildikçe spam tespitinde daha başarılı hale geliyorsa (E), o zaman model gerçekten “öğreniyor” demektir.

Buradaki temel amaç, henüz karşılaşmadığımız veriler üzerinde de iyi genelleme yapabilen modeller bulmaktır, çünkü gelecekte ilgileneceğimiz veriler bunlar olabilir. Öğrenme, modelin parametrelerini optimize ederek verideki desenleri ve yapıları otomatik olarak bulmanın bir yolu olarak düşünülebilir.

Makine öğrenmesi birçok başarı hikayesine sahip olsa da ve zengin, esnek makine öğrenmesi sistemlerini tasarlayıp eğitmek için yazılımlar kolayca erişilebilir durumda olsa da, makine öğrenmesinin matematiksel temellerinin anlaşılmasının son derece önemli olduğuna inanıyoruz.

Bu temel prensipleri kavramak, şu konularda bize büyük avantaj sağlar:

  • Yeni makine öğrenmesi çözümleri geliştirmek,
  • Mevcut yaklaşımları anlamak ve hata ayıklamak,
  • Kullandığımız yöntemlerin temel varsayımlarını ve sınırlamalarını öğrenmek.

Özetle, makine öğrenmesini sadece uygulamalı bir araç olarak görmek yerine, altında yatan matematiksel prensipleri öğrenmek, daha sağlam ve bilinçli çözümler üretmemizi sağlar.

Bu yazıda neden matematiksel altyapıya odaklıyoruz kısmını anlatmaya çalıştım, bir sonraki yazıda görüşmek üzere.

İyi kodlamalar.

Loading

Facebooktwitterredditpinterestlinkedinmail

Bilgisayar ve Zeka – A.M. Turing – 2

2. Yeni Problemin Eleştirileri ( Critique of the New Problem)

Önceki yazıda belirttiğimiz gibi sorunun yeni formundaki cevabı ne olacaktır ? Bazılarınız soruabilir : “Bu yeni öneri sorgulamaya değer mi?

Yeni problemin ilk soruya göre avantajı olayın fiziksel ve zihinsel sınırları hakkında oldukça belirgin bir çizgi çizmemizi sağlar. Hiç bir kimyager veya mühendis insan derisinden ayırt edilemeyecek bir madde üretemez. En azından şimdilik. Bu buluş yapılsa bile düşünen bir makine yapmanın en önemli adımı ona insan eti giydirmek olmayacaktır. Belirlediğimiz kurallara göre sorgulayıcının yarışmacıları görmesi, duyması, dokunması yasak olduğundan bu durum sorun teşkil etmeyecektir. Önerilen kriterlerin diğer avantajları ise aşağıdaki soru cevaplar ile gösterilebilir. Örneğin;

S: Forth Köprüsü ile ilgili bana bir mısra yazar mısın?
C: Beni geç. Ben asla şiir yazamam.

S: 34957 + 70764 toplamı kaçtır?
C: (30 Saniye bekler ve cevap verir : 105621) 

S: Satranç oynar mısın?
C: Evet.

S: Sadece K1(e1)’de şahım var. Senin ise sadece K6(e3)’da şahın ve R1(h8)’de kalen var. Hamle sırası sende.  Hamlen ne olurdu ?  (Notasyon İngiliz Notasyonu -K1,K6,R1 etc. )

C: 15 Saniye durakladıktan sonra Kale,R-R8 (h8->h1) MAT.

Soru ve cevaplardan görülebileceği gibi bu oyun herhangi bireyi dahil ederek oynanabilecek bir oyun. Makineyi güzel olmamasından dolayı cezalandırmak istemeyeceğimiz gibi bir insanı da uçakla olan  yarışı kaybetmesinden dolayı cezalandıramayız. Örnekteki gibi yetenek dışı şeylerden oyuncular sorumlu olmayacaktır. Oyuncular isterse kendi cazibeleri, kahramanlıkları, güçleri hakkında övünebilirler ancak sorgulayıcı bu konular hakkında somut deliller talep edemez.

Burada kuralların makine açısında oldukça ağır olduğunu düşünebilirsiniz. Eğer insan makine taklidi yapmaya çalışırsa aritmetik işlemlerdeki yavaşlığıyla ve tutarsızlığıyla kendini kolaylıkla ele verecektir. Ya makine düşünce olarak tanımlanacak bir şey yaparsa  veya bir insanın yaptığı şeylerden çok daha farklı şeyler yapabilirse bu durumda ne olacak ? Bu itiraz daha güçlüdür, ancak eğer makine gerçekten böyle bir şey yapabilirse zaten taklit etme oyununun hakkını vermiş demektir ki bu konuyu sorun etmeye gerek kalmaz.

Taklit etme oyununu oynarken makine için en iyi stratejinin insan davranışlarının taklit etmekten daha farklı bir şey olacağını düşünebiliriz. Bu geçerli olabilir ancak bence çok güçlü bir etki oluşturmayacaktır. Sonuçta burada oyun teorisine göre hareket etmeyeceğine göre en iyi strateji insanın verebileceği doğal cevapları üretebilmektir.

Makalenin tam versiyonuna buradan ulaşabilirsiniz.

Loading

Facebooktwitterredditpinterestlinkedinmail

Bilgisayar ve Zeka – A.M. Turing – 1

Merhaba,

Alan Turing’in 1950 yılında yazdığı  yakın zamanda okuduğum ve oldukça ilgimi çeken “Computing Machinery And Intelligence” makalesinden bahsedeceğim. Makale uzun olduğu için küçük küçük parçalar halinde yazacağım. Makalenin orijinal versiyonuna buradan ulaşabilirsiniz.

1. Taklit Etme Oyunu ( The Imitation Game )

Bu soruyu irdelemenizi öneriyorum, “Makineler düşünebilir mi?”.  Sorunun cevabı öncelikle “makine” ve “düşünce” terimlerinin tanımından geçiyor. Tanımlar kelimelerin normal kullanımını olabildiğince yansıtacak şekilde incelenip cevaplanabilir fakat bu tutum oldukça tehlikelidir.  “Makine” ve “düşünce” kavramları yaygın olarak kullanıldığı şekilde açıklanarak soruya cevap verilecek olursa “Makineler düşünebilir mi” sorusunun cevabına ulaşmak zordur. Soruya istatistiki bir şekilde yaklaşmakta yine bu nedenden dolayı absürd olacaktır. Soruyu bu şekilde tanımlamak yerine sorunun anlamını bozmayacak ve birbiriyle çelişki içermeyecek şekilde soruyu değiştirelim.

Problemi yeni şekliye “taklit etme oyunu” olarak ele alabiliriz. Bu oyun, bir erkek(A), bir bayan(B) ve sorgulayıcı(C) (herhangi bir cinsiyetten olabilir) olmak üzere üç kişi tarafından oynanan bir oyundur. Sorgulayıcı A ile B kişilerinin arasında durur ve  kimin erkek kimin bayan olduğuna karar vermeyeçalışır. Onları X ve Y etiketiyle tanır ve oyun sonunda “X, A’dır, Y, B’dir” veya “X, B’dir, Y, A’dır” diye karar verir. Sorgulayıcı (C), A ve B’ye aşağıdaki gibi sorular yöneltebilir:

C : X, Bana saçının boyundan bahseder misin?

Şimdilik X’in A olduğunu varsayalım.  Bu durumda A cevaplayacaktır. A’nın amacı C’ye yanlış cevabı verdirmektir. Bu durumda aşağıdaki şekilde cevap verebilir:

“Örülü ve 22 cm boyunda saçlarım var.”

Ses tonlarının C’ye yardımcı olmaması için cevaplar yazılı bir şekilde verilmelidir. Oyunda B’nin amacı ise yargılayıcıya yardım etmektir. B için ise en iyi strateji dürüst cevaplar vermek olabilir. Böylelikle B ” Bayan olan benim, onu sakın dinleme” diye cevap verebilir. Fakat aynı şeyleri A da söyleyebilir.

Şimdi asıl soruya gelelim. Bu oyunda A’nın yerine makine geçerse ne olurdu ? Yargılayıcı yanlış cevap verebilir miydi? Bu soru aslında “Makineler düşünebilir mi” sorusuyla aynıdır.

Loading

Facebooktwitterredditpinterestlinkedinmail