Bu bildiride, veri madenciliği (data mining) konusunun elektronik ticaretteki (electronic commerce, e-commerce) uygulamaları
vurgulanacaktır. Veri
madenciliğinin tarihçesi, günümüzdeki kullanım alanları ve eksiklikleri tespit edilecektir. Veri madenciliğinin elektronik ticarete kazandıracağı faydalar belirtilecek, veri madenciliği teknikleri ve yöntemleri incelenecektir.
Giriş Verilerin dijital ortamda saklanmaya başlanması ile birlikte, yeryüzündeki bilgi miktarının her 20 ayda bir kendini iki katına çıkardığı günümüzde veri tabanlarının sayısı da benzer, hatta daha yüksek bir oranda artmaktadır. Yüksek kapasiteli işlem yapabilme gücünün ucuzlamasının bir sonucu olarak, veri saklama hem daha kolay olmuş, hem de verinin kendisi de ucuzlamıştır.
Günümüzde oldukça yaygınlaşan elektronik ticaret ve online alışveriş mekanizmalarının da artmasıyla birlikte, bu alanda birbirlerine rakip olan firmaların çalışmaları, veri madenciliğinin önemini ön plana çıkarmaktadır.
Araştırmacıların, geniş, çok hacimli ve dağınık veri setleri üzerinde yapmış oldukları çalışmalar sonucu aşağıdaki sonuçlara varılmıştır.
Veri madenciliği ve bilgi keşfi (data mining & knowledge discovery), özellikle elektronik ticaret, bilim, tıp, iş ve eğitim alanlarındaki uygulamalarda yeni ve temel bir araştırma sahası olarak ortaya çıkmaya başlamıştır. Veri madenciliği, eldeki yapısız veriden, anlamlı ve kullanışlı bilgiyi çıkarmaya yarayacak tümevarım işlemlerini formüle analiz etmeye ve uygulamaya yönelik çalışmaların bütününü içerir. Geniş veri kümelerinden desenleri, değişiklikleri, düzensizlikleri ve ilişkileri çıkarmakta kullanılır. Bu sayede, web üzerinde filtrelemeler, DNA sıraları içerisinde genlerin tespiti, ekonomideki eğilim ve düzensizliklerin tespiti, elektronik alışveriş yapan müşterilerin alışkanlıkları gibi karar verme mekanizmaları için önemli bulgular elde edilebilir.
Sayısal verinin miktarı, son 10 yılda bir patlama yaşayarak tahminlerin dışında bir artış göstermiştir. Buna karşılık, bilim adamlarının, mühendislerin ve analistlerin sayısı değişmemektedir. Bu orantısızlığı gidermek için yeni araştırma problemlerinin çözümleri birkaç gruba ayrılabilir :
Geniş hacimli ve çok boyutlu veri madenciliği için yeni algoritma ve sistemlerin
geliştirilmesi,
Yeni veri tiplerinin madenciliği için yeni algoritma, teknik ve sistemlerin geliştirilmesi,
Dağıtık veri madenciliği için algoritma, protokol ve altyapıların geliştirilmesi,
Mevcut veri madenciliği sistemlerinin kullanımının ilerletilip geliştirilmesi,
Veri madenciliği için özel gizlilik ve güvenlik modellerinin geliştirilmesi.
Tüm bu uğraşların başarıya ulaşması ve sonuç verebilmesi için hükümetin ve çok disiplinli ve disiplinler arası çalışan iş sahalarının desteği gereklidir.
İlgili sistemlerin, ölçülmüş altyapıların ve test ortamlarının oluşturulmasını gerektiren önemli deneysel bileşenlerin gerçekleştirilmesi gerekir.
iletişim :
Email : alper@yedinet.com , inceoglu@staff.ege.edu.tr Adres : Ege Üniversitesi Bilgisayar Mühendisliği Bölümü Bornova 35100, İZMİR Tel : +90 232 388 7221 Faks : +90 232 339 9405