Artık neredeyse aramızda Büyük Veri kavramı ile karşılaşmayanımız yoktur. Aynı solduğumuz oksijen gibi her an iç içe olmamıza rağmen tam anlamıyla nasıl çalıştığı hakkında pek azımız hariç fikir sahibi değiliz. Bu durumu daha nitelikli ifadelendirmek gerekirse Michio Kaku’dan yardım alabiliriz.
Ünlü Fizikçi internet için “everywhere and nowhere” tabirini kullanıyordu. Aynı şeyi büyük veri için de söyleyebiliriz. Hem her yerde hem de o kadar aşinayız ki varlığı farkındalık düzeyimizin altında kaldığı için hiçbir yerde! Kısaca özetleyeceğimiz Büyük Veri İş Başında kitabında tıptan perakendeye, savunma sanayisinden eğlence sektörüne, sosyal medya devlerinden tarım sektörüne kadar büyük verinin nasıl kullanıldığı örneklerle anlatılıyor. Kitap bu yönüyle konu hakkında bilgi sahibi olmayıp fikir edinmek isteyenlere hitap ettiği gibi, bu şirketlerin büyük veriyi kullanırken yararlandıkları ileri teknoloji çözümlerini de hikayesine dahil etmesi nedeniyle teknoloji konusuna aşina olanlara da hitap ediyor.
Kitapta büyük veri çözümlerine yer verilen şirketlere kısaca göz atmak isterseniz; Walmart, Netflix, John Deere, LinkedIn, Palantir, BBC, Google, Amazon, CIA, Pentagon, Uber, Walt Disney, CERN de dahil olmak üzere 45 büyük veri çözümünün hangi problemi ortadan kaldırmak için kullanıldığını öğrenebilirsiniz. Birkaçına kısa değinmek gerekirse:
Walmart
Walmart mağazalarında büyük veri analizini bir adım öteye taşıyor ve anlık satış verilerinden gerçek zamanlı büyük veri analizi yaparak mağazaları izliyor. Bir Cadılar Bayramı’nda küçük kurabiyelerin satış rakamlarının takip edildiği ve analistlerin birkaç yerde bunların hiç satılmadığını fark ettikleri bir örneği hatırlıyorlar. Mağazalardaki satın alma ekibi uyarıldıktan sonra kurabiyelerin hiç raflara konulmadığı fark ediliyor. Basit ama etkili bir çözüm.
“Gittikçe daha dijital hale gelen dünyamızda yaptığımız her şey geride bir veri izi bırakır. Bu, mevcut veri miktarının gerçekten de patladığı anlamına gelir. Geçtiğimiz iki yıl içinde, insanoğlunun önceki tüm tarih boyunca ürettiğinden daha fazla veri yarattık. 2020 itibariyle gezegendeki her insan için her saniye yaklaşık 1,7 MB yeni verinin yaratılacağı tahmin ediliyor. “
Palantir
ABD, Afganistan’da, Deniz Kuvvetleri’ni desteklemek için büyük verinin gücünden yararlanmaya karar verdi ve Palantir’in kapısın çaldı. Çok çeşitli, yapılandırılmış ve yapılandırılmamış verileri analiz ederek cephedeki askerlere istihbarat sağlayan Palantir, DNA veritabanları, izleme kayıtları, sosyal medya verileri, muhbirlerden ve sensörlerden gelen veriler, coğrafi veriler, hava durumu verileri ve biyometrik verileri de içeren karmaşık bir büyük veri kümesini yönetiyordu. Sonuç olarak hava durumu verileri ile doğaçlama patlamalar arasında ve el yapımı patlayıcılardan toplanan biyometrik veriler ile bireyler / gruplar arasında bağlantı olduğu tespit edildi. Normal şartlar altında bu veriler arasındaki bağıntıyı herhangi bir insanın kurması mümkün değildi.
Terra Seismic
Şirket, depremleri ve depremlerin neden olabileceği tsunamileri önceden tahmin edebilmek için 2012 yılında kuruldu. Terra Seismic dünyanın herhangi bir yerindeki depremi yüzde 90 doğrulukla tahmin edebileceğini belirtiyor. Bunun için uydu görüntülerinden ve atmosferik sensörlerden alınan canlı yayın verileri, önceki depremlerden elde edilen verilerle eş zamanlı olarak analiz ediliyor. Atmosferik koşullar, enerji salımıyla ilişkili göstergeler sunabiliyor ve hatta sıra dışı bulut oluşumları bir depremin ne zaman olacağına dair ipuçları verebiliyor. Bir araya getirilen tüm bu veriler Terra Seismic’in öngörücü modelleme teknikleriyle değerlendirildiğinde daha nitelikli tahminler yapılabiliyor. Bu tahmin verilerinden ise sigorta şirketleri risk değerlendirmesi yapmak, fonlar ve borsacılar doğal afetlerin finans piyasalarına etkisini tahmin etmek, yardım kuruluşları ise olası bir depreme karşı hazırlık yapmak için yararlanıyor.
Twitter verileri de oldukça yararlı bir veri seti sunabiliyor. Bir gıda ve içecek perakendecisi en sadık müşterilerinin para harcama kalıplarının satış yerlerindeki personel değişiminden olumsuz etkilendiği sonucuna vararak, yüksek personel değişimi oranı ile düşük müşteri sadakati arasında sıkı bir ilişki kurdu. Diğer bir deyişle tezgahın arkasında hep aynı aşina yüzleri görmek çok para harcayan müşterileri dükkana daha sık gelmeye teşvik ediyordu
“İnsanlar, verilerdeki belli bir faaliyet örüntüsünün, bir olayın gerçekleşme olasılığıyla ilişkisini fark edemeyebilir. Ama bir korelasyon varsa, bilgisayar bunu tespit edecektir.”
Bugün, büyük veriden değer yaratılması mümkün oluyorsa bunun en önemli nedeni yapay zeka sistemlerinin kullanılabilmesidir. Aslında burada tam da palindrom benzeri bir durum var da diyebiliriz. Bu cümleyi tersten kurduğumuzda da yine doğru bir sonuca ulaşabiliyoruz. Yapay zekanın da bu düzeyde gelişebilmesinin en önemli nedeni de tüm dünyada artan veri miktarıdır. Zira yapay zekanın yeteneklerini geliştirmek ve veriden anlam çıkarabilecek düzeye getirebilmek için yapay zekayı uzunca bir süre büyük veri setleriyle eğitmek gerekiyor.
Büyük veri ve yapay zeka günümüzde ağırlıklı olarak iki fonksiyon için kullanılıyor; derlenen verilerden anlamlı örüntüler oluşturmak, oluşturulan bu örüntülerle gerçeğe yakın tahminde bulunabilmek. Yıllar önce çiftçiler tarım yapabilmek için hava tahmini konusunda köyün yaşlılarına güveniyordu, piyasa koşulları için tecrübeli esnaflara ve bölgesel suç olayları için de tecrübeli kolluk görevlilerine… Şimdi ise tüm bu tahminler, farklı kaynaklardan elde edilen ve yıllara yayılan kayıtlardan anlamlı örüntüler üreten yapay zeka yazılımları ile gerçekleştiriliyor.
Yapılan tahminlerin tutarlılığını artıran en önemli etken ise farklı kaynaklardan elde edilen verilerdir. Aslında bu durumu kendi akıllı telefon kullanımımızda da sıklıkla yaşarız, dilerseniz hemen test edebilirsiniz. Örneğin herhangi bir arkadaşınıza mesajlaşma uygulamalarından biriyle konum bilginizi iletmeyi deneyin. Eğer GPS sinyallerini zayıflatacak bir ortamda konumu ilettiyseniz konum doğruluğunuz azalacaktır, fakat bir de Wi-Fi bağlantınızı aktifleştirerek konumunuzu iletmeyi deneyin. Herhangi bir Wi-Fi ağına bağlı olmasanız bile GPS konum verileri, Wi-Fi sinyallerinin konumları ile doğrulanacak ve mesajlaşma uygulamalarından konumunuzu daha keskin bir doğrulukta paylaşabileceksiniz. Hele bir de Bluetooth verilerini de eklediğinizde doğruluk oranını daha da artırabilirsiniz, aşağıdaki iki örnekte olduğu gibi…
Aynı kurgu bütün ön görücü modeller için de geçerlidir, daha detaylı bilgi için Sosyal Medya Verileri ile Suç Tahmini Mümkün mü? Başlıklı makaleyi okuyabilirsiniz.
Kaynaklar