ahmet gul
25 Kasım 2011 Cuma
VERİ MADENCİLİĞİ
Tanım: Veri madenciliği, büyük ölçekli veriler arasından bilgiye ulaşma, bilgiyi madenleme işidir. Ya da bir anlamda büyük veri yığınları içerisinden gelecek ile ilgili tahminde bulunabilmemizi sağlayabilecek bağıntıların bilgisayar programı kullanarak aranmasıdır. Veri madenciliği deyimi yanlış kullanılan bir deyim olabileceğinden buna eş değer başka kullanımlar da literatüre geçmiştir. Veritabanlarında bilgi madenciliği (knowledge mining from databases), Bilgi çıkarımı(knowledge extraction), data/pattern anaysis (veri ve örüntü analizi), veri arkeolojisi gibi.
Bunların arasındaki en popüler kullanım Veritabanlarında Bilgi Keşfi (VBK – Knowledge Discovery From Databases – KDD) ‘dir. Alternatif olarak veri madenciliği aslında bilgi keşfi sürecinin bir parçası şeklinde kabul görmektedir. Bu adımlar:
1-) Veri Temizleme (gürültülü ve tutarsız verileri çıkarmak)
2-) Veri Bütünleştirme (birçok veri kaynağını birleştirebilmek)
3-) Veri Seçme (Yapılacak olan analiz ile ilgili olan verileri belirlemek )
4-) Veri Dönüşümü (Verinin veri madenciliği tekniğinden kullanılabilecek hale dönüşümünü gerçekleştirmek)
5-) Veri Madenciliği (Veri örüntülerini yakalayabilmek için akıllı metotları uygulamak)
6-) Örüntü Değerlendirme (Bazı ölçümlere göre elde edilmiş bilgiyi temsil eden ilginç örüntüleri tanımlamak)
7-) Bilgi Sunumu (Madenciliği yapılmış olan elde edilmiş bilginin kullanıcıya sunumunu gerçekleştirmek)
Veri madenciliği adımı, kullanıcı ve bilgi tabanı ile etkileşim halindedir. İlginç örüntüler kullanıcıya gösterilir, ve bunun ötesinde istenir ise bilgi tabanına da kaydedilebilir. Buna göre, veri madenciliği işlemi, gizli kalmış örüntüler bulunana kadar devam eder. Bir veri madenciliği sistemi, aşağıdaki temel bileşenlere sahiptir:
·Veritabanı, veri ambarı ve diğer depolama teknikleri
·Veritabanı ya da veri ambarı Sunucusu
·Bilgi Tabanı
·Veri Madenciliği Motoru
·Örüntü Değerlendirme
·Kullanıcı Arayüzü
Veri madenciliği, eldeki verilerden üstü kapalı, çok net olmayan, önceden bilinmeyen ancak potansiyel olarak kullanışlı bilginin çıkarılmasıdır. Bu da; kümeleme, veri özetleme, değişikliklerin analizi, sapmaların tespiti gibi belirli sayıda teknik yaklaşımları içerir.
Başka bir deyişle, veri madenciliği, verilerin içerisindeki desenlerin, ilişkilerin, değişimlerin, düzensizliklerin, kuralların ve istatistiksel olarak önemli olan yapıların yarı otomatik olarak keşfedilmesidir.
Temel olarak veri madenciliği, veri setleri arasındaki desenlerin ya da düzenin, verinin analizi ve yazılım tekniklerinin kullanılması ile ilgilidir. Veriler arasındaki ilişkiyi, kuralları ve özellikleri belirlemekten bilgisayar sorumludur. Amaç, daha önceden fark edilmemiş veri desenlerini tespit edebilmektir.
Veri madenciliğini istatistiksel bir yöntemler serisi olarak görmek mümkün olabilir. Ancak veri madenciliği, geleneksel istatistikten birkaç yönde farklılık gösterir. Veri madenciliğinde amaç, kolaylıkla mantıksal kurallara ya da görsel sunumlara çevrilebilecek nitel modellerin çıkarılmasıdır. Bu bağlamda, veri madenciliği insan merkezlidir ve bazen insan – bilgisayar arayüzü birleştirilir. Veri madenciliği sahası, istatistik, makine bilgisi, veritabanları ve yüksek performanslı işlem gibi temelleri de içerir.
Veri madenciliği konusunda bahsi geçen geniş verideki geniş kelimesi, tek bir iş istasyonunun belleğine sığamayacak kadar büyük veri kümelerini ifade etmektedir. Yüksek hacimli veri ise, tek bir iş istasyonundaki ya da bir grup iş istasyonundaki disklere sığamayacak kadar fazla veri anlamındadır. Dağıtık veri ise, farklı coğrafi konumlarda bulunan verileri anlatır.
30 Ekim 2011 Pazar
17 Ekim 2011 Pazartesi
9 Ekim 2011 Pazar
İNTERNETİN TARİHÇESİ
İnternetin köklerini 1962 yılında J.C.R. Licklider'in Amerika'nın en büyük üniversitelerinden biri olan Massachusetts Institute of Tecnology'de (MIT) tartışmaya açtığı "Galaktik Ağ" kavramında bulabiliriz. Licklider, bu kavramla küresel olarak bağlanmış bir sistemde isteyen herkesin herhangi bir yerden veri ve programlara erişebilmesini ifade etmişti. Licklider 1962 Ekim ayında Amerikan Askeri araştırma projesi olan İleri Savunma Araştırma Projesi'nin (DARPA - Defense Advensed
Research Project Agency) bilgisayar araştırma bölümünün başına geçti. MIT'de araştırmacı olarak çalışan Lawrance Roberts ile Thomas Merrill, bilgisayarların ilk
kez birbirleri ile 'konuşmasını' ise 1965 yılında gerçekleştirdi.
1966 yılı sonunda Roberts DARPA'da çalışmaya başladı ve "ARPANET" isimli projesi önerisini yaptı. ARPANET çerçevesinde ilk bağlantı 1969 yılında dört merkezle yapıldı ve ana bilgisayarlar arası bağlantılar ile internetin ilk şekli ortaya çıktı. ARPANET'İ oluşturan ilk dört merkez University of California at Los Angeles (UCLA), Stanford Research Institute (SRI), University of Utah ve son olarak University of California at Santa Barbara (UCSB) idi (Gromov, 1998).
Kısa süre içerisinde birçok merkezdeki bilgisayarlar ARPANET ağına bağlandı.
1971 yılında Ağ Kontrol protokolü (NCP-Network Control Protokol)ismi verilen bir protokol ile çalışmaya başladı. 1972 yılı Ekim ayında gerçekleştirilen Uluslararsı Bilgisayar İletişim Konferansı (ICCC- International Computer Communications Conference) isimli Konferansta, ARPANET'in NCP ile başarılı bir demontrasyonu gerçekleştirildi. Yine bu yıl içinde elektronik posta (e-mail) ilk defa ARPANET içinde kullanılmaya başladı. NCP'DEN daha fazla yeni olanaklar getiren yeni bir protokol,
1 Ocak 1983 tarihinde İletişim Kontrol Protokolu (Transmission Control Protokol/ internet protokol - TCP/IP) adıyla ARPANET içinde kullanılmaya başladı. TCP/IP bugün varolan internet ağının ana halkası olarak yerini aldı.
Internet‘e çeşitli şekillerde, başlangıcından 1994 yılı sonuna kadar 110 ülke, 10,000 bilgisayar ağı, 3,000,000 dan fazla bilgisayar ve 25 milyonu aşkın kullanıcı bağlanmıştır. Bu sayı, Web Sayfası kavramının kullanıma girdiği 1995 yılı içinde büyük bir patlama göstermiş ve 60 milyon’a ulaşmıştır. Bu sayının 1996 yılı içinde de, her ay yüzde 10 artması beklenmekteydi. Ve şu an Türkiye' de 5 Milyon, Dünyada toplam 300 Milyon İnternet kullanıcısı olduğu sanılıyor. Görüldüğü üzere Internet büyük bir hızla dünyanın her köşesine din, dil, ırk ve ülke ayrımı yapmadan erişmektedir. Şu an yeni yüzyılın en büyük iletişim ve reklam araçlarının başında gelmektedir.
Internet, teknik olarak, TCP/IP protokolü ile desteklenen pek çok servis sunar. Örnek olarak, Internet erişimi olan bir kullanıcı, eğer kendisine yetki verilmişse, Internet’ e bağlı diğer herhangi bir bilgisayardaki bilgilere erişebilir, onları kendi bilgisayarına alabilir, kendi bilgisayarından da Internet erişimi olan başka bir bilgisayara dosya/bilgi gönderebilir. Bu özellik, dosya transfer protokolü olarak bilinir. Benzer şekilde, Internet üzerindeki kullanıcılar birbirlerine elektronik posta gönderebilirler.
İçerik bakımından ise, Internet’ in sundukları bazen insan hayal gücünü zorlayacak boyutlara varmaktadır. Vizyondaki filmlerin kısa tanıtımlarını kolayca evimizdeki ekrana taşıyabilir ya da Amerikan Kongre Kütüphanesi’ nde tarama yapabiliriz, TÜBİTAK arşivine bağlanıp Bilim ve Teknik dergilerinin yeni ve eski sayılarını tarayabilir, yazıları okuyabiliriz, Hacettepe Üniversitesi’ ne uzanıp o anki Beytepe Kampüsü sıcaklıklarını grafiksel olarak görebiliriz, katılmak istediğimiz bir bilimsel toplantıya bildirimizi Internet üzerinden gönderebiliriz. Örnekleri arttırmak mümkün; NASA servislerine bağlanıp, son uydu fotoğraflarını tarayabiliriz, şiir arşivlerine bağlanıp şiirler okuyabiliriz. Son yıllarda geliştirilen World Wide Web ve (yavaş yavaş unutulmasına rağmen, o bir klasikti) Gopher gibi modern Internet araçları ile bilgiye ulaşım daha da kolaylaşmış, ulaşılabilecek bilgiler ve sunulan servisler miktar ve çeşit olarak artmışlardır. Internet’ in sundukları; onu kullananların istekleri, hayal güçleri ve gelişen Internet teknolojisi ile hep artmaktadır.
Internet, bilgiye ulaşmayı kolaylaştırmak için değişik ‘bilgi tarama’ yöntemleri de sunar. Bu servislerden bazıları; Archie, Veronica, Jughead, Whois, Virtual Libraries olarak listelenebilir. Internet’ in sundukları çok geniştir ve bu kadar bilgi arasında, bilinçsiz bir kullanımla, insan yolunu çok kolay kaybedebilir.
Internet' e kişisel bağlantı için bir bilgisayara, bir modeme, bir telefon bağlantısına ve servis sağlayıcıdan alınmış kullanıcı şifresine gereksinim vardır.
İnternetin köklerini 1962 yılında J.C.R. Licklider'in Amerika'nın en büyük üniversitelerinden biri olan Massachusetts Institute of Tecnology'de (MIT) tartışmaya açtığı "Galaktik Ağ" kavramında bulabiliriz. Licklider, bu kavramla küresel olarak bağlanmış bir sistemde isteyen herkesin herhangi bir yerden veri ve programlara erişebilmesini ifade etmişti. Licklider 1962 Ekim ayında Amerikan Askeri araştırma projesi olan İleri Savunma Araştırma Projesi'nin (DARPA - Defense Advensed
Research Project Agency) bilgisayar araştırma bölümünün başına geçti. MIT'de araştırmacı olarak çalışan Lawrance Roberts ile Thomas Merrill, bilgisayarların ilk
kez birbirleri ile 'konuşmasını' ise 1965 yılında gerçekleştirdi.
1966 yılı sonunda Roberts DARPA'da çalışmaya başladı ve "ARPANET" isimli projesi önerisini yaptı. ARPANET çerçevesinde ilk bağlantı 1969 yılında dört merkezle yapıldı ve ana bilgisayarlar arası bağlantılar ile internetin ilk şekli ortaya çıktı. ARPANET'İ oluşturan ilk dört merkez University of California at Los Angeles (UCLA), Stanford Research Institute (SRI), University of Utah ve son olarak University of California at Santa Barbara (UCSB) idi (Gromov, 1998).
Kısa süre içerisinde birçok merkezdeki bilgisayarlar ARPANET ağına bağlandı.
1971 yılında Ağ Kontrol protokolü (NCP-Network Control Protokol)ismi verilen bir protokol ile çalışmaya başladı. 1972 yılı Ekim ayında gerçekleştirilen Uluslararsı Bilgisayar İletişim Konferansı (ICCC- International Computer Communications Conference) isimli Konferansta, ARPANET'in NCP ile başarılı bir demontrasyonu gerçekleştirildi. Yine bu yıl içinde elektronik posta (e-mail) ilk defa ARPANET içinde kullanılmaya başladı. NCP'DEN daha fazla yeni olanaklar getiren yeni bir protokol,
1 Ocak 1983 tarihinde İletişim Kontrol Protokolu (Transmission Control Protokol/ internet protokol - TCP/IP) adıyla ARPANET içinde kullanılmaya başladı. TCP/IP bugün varolan internet ağının ana halkası olarak yerini aldı.
Internet‘e çeşitli şekillerde, başlangıcından 1994 yılı sonuna kadar 110 ülke, 10,000 bilgisayar ağı, 3,000,000 dan fazla bilgisayar ve 25 milyonu aşkın kullanıcı bağlanmıştır. Bu sayı, Web Sayfası kavramının kullanıma girdiği 1995 yılı içinde büyük bir patlama göstermiş ve 60 milyon’a ulaşmıştır. Bu sayının 1996 yılı içinde de, her ay yüzde 10 artması beklenmekteydi. Ve şu an Türkiye' de 5 Milyon, Dünyada toplam 300 Milyon İnternet kullanıcısı olduğu sanılıyor. Görüldüğü üzere Internet büyük bir hızla dünyanın her köşesine din, dil, ırk ve ülke ayrımı yapmadan erişmektedir. Şu an yeni yüzyılın en büyük iletişim ve reklam araçlarının başında gelmektedir.
Internet, teknik olarak, TCP/IP protokolü ile desteklenen pek çok servis sunar. Örnek olarak, Internet erişimi olan bir kullanıcı, eğer kendisine yetki verilmişse, Internet’ e bağlı diğer herhangi bir bilgisayardaki bilgilere erişebilir, onları kendi bilgisayarına alabilir, kendi bilgisayarından da Internet erişimi olan başka bir bilgisayara dosya/bilgi gönderebilir. Bu özellik, dosya transfer protokolü olarak bilinir. Benzer şekilde, Internet üzerindeki kullanıcılar birbirlerine elektronik posta gönderebilirler.
İçerik bakımından ise, Internet’ in sundukları bazen insan hayal gücünü zorlayacak boyutlara varmaktadır. Vizyondaki filmlerin kısa tanıtımlarını kolayca evimizdeki ekrana taşıyabilir ya da Amerikan Kongre Kütüphanesi’ nde tarama yapabiliriz, TÜBİTAK arşivine bağlanıp Bilim ve Teknik dergilerinin yeni ve eski sayılarını tarayabilir, yazıları okuyabiliriz, Hacettepe Üniversitesi’ ne uzanıp o anki Beytepe Kampüsü sıcaklıklarını grafiksel olarak görebiliriz, katılmak istediğimiz bir bilimsel toplantıya bildirimizi Internet üzerinden gönderebiliriz. Örnekleri arttırmak mümkün; NASA servislerine bağlanıp, son uydu fotoğraflarını tarayabiliriz, şiir arşivlerine bağlanıp şiirler okuyabiliriz. Son yıllarda geliştirilen World Wide Web ve (yavaş yavaş unutulmasına rağmen, o bir klasikti) Gopher gibi modern Internet araçları ile bilgiye ulaşım daha da kolaylaşmış, ulaşılabilecek bilgiler ve sunulan servisler miktar ve çeşit olarak artmışlardır. Internet’ in sundukları; onu kullananların istekleri, hayal güçleri ve gelişen Internet teknolojisi ile hep artmaktadır.
Internet, bilgiye ulaşmayı kolaylaştırmak için değişik ‘bilgi tarama’ yöntemleri de sunar. Bu servislerden bazıları; Archie, Veronica, Jughead, Whois, Virtual Libraries olarak listelenebilir. Internet’ in sundukları çok geniştir ve bu kadar bilgi arasında, bilinçsiz bir kullanımla, insan yolunu çok kolay kaybedebilir.
Internet' e kişisel bağlantı için bir bilgisayara, bir modeme, bir telefon bağlantısına ve servis sağlayıcıdan alınmış kullanıcı şifresine gereksinim vardır.
8 Ekim 2011 Cumartesi
Kaydol:
Kayıtlar (Atom)