Veri madenciliğinin büyük veri setlerinden önemli bilgileri istatiksel ve matematiksel metotlar yoluyla ortaya çıkarma aracı olduğunu belirten Üsküdar Üniversitesi Mühendislik ve Doğa Bilimleri Fakültesi Bilgisayar Mühendisliği Bölüm Başkanı Prof. Dr. Serhat Özekes, “Bu bilgiler, veriler arasındaki gizli ilişkileri ve desenleri belirtebileceği gibi diğer veri gruplarından bazı özellikleri nedeniyle ayrılan aykırı değerleri de ortaya çıkarabilir. Bu yapılan çıkarımlar ise iyileştirmelerin, sınıflandırmaların ve geleceğe yönelik tahminlerin yapılmasına olanak sağlar.” dedi
İnsan gözüyle görülemeyen eğilimlerin tespiti yapılabiliyor
Prof. Dr. Serhat Özekes, günümüzde akıllı cihazların kullanımının yaygınlaşması ve işlem gücünün artmasıyla en basit platformlardan en gelişmiş endüstrilere kadar her gün yüksek boyutlarda veri üretildiğini söyledi ve sözlerine şöyle devam etti:
“Yüksek kapasiteli depolama donanımlarına erişimin kolaylaşmasıyla elde edilen veri artarken, bilgiye ulaşımın hızlanmasıyla da bilgiye talep arttı. Depolanmış veri tek başına bir önem arz etmediği için diğer ilişkili verilerle birlikte işlenip bilgiye olan bu açlığın giderilmesi gerekiyor. İşte veri madenciliği de tam olarak bu yüzden sıklıkla ihtiyaç duyulan bilgiyi keşfetme yollarından biri olarak karşımıza çıkıyor. Veri madenciliği; insan gözüyle görülmesi mümkün olmayan finansal eğilimlerin keşfedilmesi, güvenlik açıklarının tespiti, gen haritalandırma ve pazar analizi gibi günümüzde önemle yürütülen uygulamaları mümkün kılıyor. Sağlık alanında ise medikal ürünlerde sahtecilik tespiti ve klinik uygulamaların etkilerinin ölçülmesinde sıklıkla kullanılıyor. Güvenlik alanında veri madenciliğinin olası dolandırıcılıkları tespit edebildiği uygulamalar da mevcut.”
Veri analizi, veriyi işlenebilir hale getiriyor
Veri analizi ve veri madenciliğinin benzer amaçlara hizmet edip genellikle bir arada yürütülse de aslında temelde birbirinden farklı iki alan olduğunu ifade eden Özekes, şöyle konuştu:
“Veri madenciliği, makine öğrenmesi ve istatistik yoluyla gizli bilgileri ortaya çıkarmaya odaklıyken, veri analizinin amacı veri setlerini analiz için uygun hale getirip belirli bir hipotez üzerine matematiksel ve görsel değerlendirmelerde bulunuyor. Veri analizi yapılırken veri işlenebilir hale getiriliyor, matematiksel analizler yapılıyor ve oluşturulan hipotezler görsel araçlar yardımıyla destekleniyor.”
Birçok alanda veri analizi kullanılıyor
Veri analizinin bankacılık, üretim, e-ticaret, reklamcılık, güvenlik, sağlık, biyoloji, medya ve iletişim gibi birçok alanın temellerini oluşturduğunu vurgulayan Özekes, “Örneğin, bankalar müşterilerinin ihtiyaç ve harcamalarından elde ettikleri veriyi kullanarak onların satın alma profillerini oluşturma yoluyla ilgilerini çekecek tekliflerde bulunabiliyorlar. Ticari bir firma, müşterilerin tercihlerine göre hangi ürünlerin birlikte satın alındığını analiz ederek belirli bir ürün grubunda üretimin artırılmasını veya yeniden stoklanmasını tercih edebiliyor.” dedi.
İnternete bağlı cihazlar artınca veri miktarı da arttı
Prof. Dr. Serhat Özekes, ‘Veriler her türlü ölçüm yapan elektronik cihazdan, fotoğraf ve video çekebilen multimedya cihazlarından ve webden elde edilebildiği gibi işlenmeden önce veri bilimciler tarafından temizlenerek analiz edilebilir hale getirilmesi gerekiyor’ dedi ve sözlerine şöyle devam etti:
“Günümüzde internete bağlı cihazların artmasıyla oluşturulan veri miktarı da arttı. Bu verilerin toplanması, gelecekte tarihsel verilere ulaşımın kolaylaşması adına önem arz ediyor. Veri madenciliğinde önemli bir yere sahip olan tarihsel veriler, geçmiş zaman aralığındaki verilerin değerlendirilmesiyle gelecek yıllar için tahmini modeller ve eğilim (trend) grafikleri oluşturulmasına imkan tanıyor. Örneğin, ekonomide büyük öneme sahip olan zaman serisi tahmini yöntemi ile bir hisse senedinin geçmiş değerlerinden yola çıkarak gelecekte nasıl şekilleneceği öngörülebiliyor. Diğer bir örnek olarak üretimci şirketlerin satışlarını iyileştirmek için pazarın geçmiş dönemlerdeki verilerine yönelik veri madenciliği çalışmalarıyla üretim kolunu organize etmelerine olanak sağlaması verilebilir. Bunun gibi veri madenciliği uygulamaları, endüstrilerin planlı hamleler yapıp en verimli şekilde hizmet sunmasına katkıda bulunuyor.”
Sonuç olarak teknolojik gelişmelerle artan bilgi ihtiyacı ile veri madenciliğinin son yılların en önemli bilgiye ulaşma yollarından birisi haline geldiğini vurgulayan Prof. Dr. Serhat Özekes, “Daha önceden görülmesi ve çıkarım yapılması mümkün olmayan desenler, çeşitli makine öğrenmesi yöntemleriyle keşfedilip kullanışlı bilgiye dönüştürebilir. Verilerin düzenli şekilde toplanması, yakın ve uzak gelecekteki veri bilimi uygulamalarında bir referans olması açısından önem taşıyor.” ifadelerini kullandı.