Büyük Veri (Big Data) nedir, Veri madenciliği ile bir alakası var mı?

  

Büyük veri, sosyal medya,  klasik şirket veri tabanları, haritalar gibi farklı yerlerden toplanmış, resim, metin, video veya ses gibi dosya formatlarından oluşan veriler topluluğudur. Büyük dememizin sebebi sadece büyük olması değildir. Tabii ki, miktar olarak büyüktür ancak, tek başına bu veri setine “Büyük Veri” dememiz için yeterli değildir. Büyüklük onun beş özelliğinden sadece biridir. Örneğin, Büyük Verinin resim, ses, metin gibi değişik türlerde olması; sosyal medyada ya da web üzerinde olduğu gibi hızlı bir şekilde artıyor ya da ekleniyor olması; geçerli, tutarlı ve güvenilir olması;  değerli ya da işlemeye değerli olması Büyük Verinin diğer özellikleridir. Bunun veri madenciliğiyle ne alakası var derseniz, veri madenciliği isminden de anlaşılacağı gibi doğrudan verilerle uğraşır. Dolayısıyla Büyük Veri bizim için gerçek anlamda bir madendir. Ancak, büyük verinin veri madencisi tarafından, öncelikle analize hazırlanması gerekmektedir. İşletme içerisindeki verilerde büyük verinin sadece bir parçası olabilir. Bir işletmede analize hazır büyük veri bulmak her zaman mümkün değildir. Bu verilerin dış verilerle desteklenmesi gerekir ve bunun içinde bir uzmana ihtiyaç vardır. Örneğin, Coca Cola, Levi’s, Google gibi firmalarda bu tür veri analizi uzmanlarından oluşan birimler mevcuttur.

  • Sosyal Medya Big Data mıdır?

Evet.  Ancak, tek başına sosyal medyaya Büyük Veri demek çoğunlukla doğru olmaz. Sosyal Medya, Büyük Veriyi oluşturan önemli parçalarından sadece biridir, bununla birlikte diğer kaynaklarla desteklenmesi ve en önemlisi veri ambarına dönüştürülmesi gerekmektedir.