Big Data( Büyük VERİ)
description
Transcript of Big Data( Büyük VERİ)
BIG DATA(BÜYÜK VERİ)
Cemil ŞENELYüksel BİLGİCİ
Teknolojik bir çözüm, kullanımından elde edilen maliyet ve faydalara göre
degerlendirmeye tabi tutulur ve avantaj saglıyorsa tercih edilir.
BIG DATA(BÜYÜK VERİ)• Toplumsal medya
paylaşımları, ağ günlükleri, bloglar, fotoğraf, video, log dosyaları v.b. gibi değişik kaynaklardan toparlanan yapısal olmayan VERİ yığınıdır.
• Daha önce analizi mümkün olmayan muazzam büyüklük ve/veya çeşitlilik ve/veya akışkanlıktaki VERİler üzerinden bilgiye erişimdir.
BÜYÜK VERİ Son 3 yılda, geçmiş 40 bin yılda üretilen
VERİden 4 kat daha fazla VERİ ortaya çıkmıştır 2012 yılında 2,500 Exabyte yeni bilgi
üretilmiştir (ana etken: dijital içerikler) Digital evren, 2012’de 2.7 zetabyte ’a
yükselmiş, 2020’de 35 “zetabyte” olması beklenmektedir.
Dünyada her dakikada 1,7 milyon trilyon byte VERİ üretilmektedir ki bu, 360.000 DVD’ye eşdeğerdir.
Source: An IDC White Paper. As the Economy Contracts, the Digital Universe Expands.
BÜYÜK VERİ
BÜYÜK VERİ Google 2008’de günde 20 PB VERİ
işlerken 2013’te günlük 100 PB veri işlemiştir.
Facebook 2009’da sahip olduğu 2,5 PB kullanıcı verisine her gün 15 TB’lık veri eklerken 2013’te 300 PB veriye günde 500 TB veri eklemiş ve dünyadaki fotoğrafların %35’ini barındırmıştır.
CERN’in Büyük Hadron Çarpıştırıcısı yılda 15 PB veri üretmektedir.
BÜYÜK VERİNİN KAYNAKLARI
Web Hareketleri(Tarama,Tıklanma Sayısı, Gezinme)
Mobil İnternet, Sosyal Ağ, Sensör VERİleri, HD Video, E-mail, Ses, SMS, MMS Demografik Bilgiler v.b. dışındaki her
türlü bilgi.
NEYİ BÜYÜK VERİ OLARAK KABUL EDECEĞİZ?
Bir verinin büyük olması için gereken özellikler: Hacim(Volume) Hız (Velocity) Çeşitlilik (Variety) Doğruluk (Veracity)Ve sonucunda; Değer (Value)
BÜYÜK VERİNİN ÖZELLİKLERİ;
BÜYÜK VERİ KULLANIM ALANLARI
Büyük Veri Arama: Karar verme sürecini daha etkin kılmak için tüm büyük veri kaynaklarını aramak, analiz etmek ve görselleştirmek.
360^0 Müşteri Görüntüsü: Bütün veri kaynaklarıyla müşteri analizi yapmak.
Güvenlik ve İstihbarat Yetkinlikleri: Düşük risk, gerçek zamanlı dolandırıcılık izleme ve siber güvenliği sağlamak.
Operasyon Analizi: Anlık sensör ve log analizi yaparak karar destek süreçlerini beslemek.
Veri Ambarı Eklentisi: Nadiren erişilen, saklama maliyetleri yüksek veri ambarlarını tutmak yerine, veriyi kaynağında işleyerek veri ambarı işletim maliyetlerinin düşmesini sağlamak
BÜYÜK VERİ KULLANARAK BİLGİ ÇIKARIMI
Bilgi çıkarımı; dağıtık programlama, örüntü tanıma, veri madenciliği, doğal dil işleme, duygu analizi, istatistiksel ve görsel analiz ve insan bilgisayar etkileşimi gibi çeşitli analiz metotlarını içerir.
Kapsamlı bir bilgi çıkarımı mimarisi üretim hattında sağlanmalı ve işletilmelidir. Hatalara, kayıp değerlere ve kullanışsız formatlara uygun çözümler bulmak için veri ve toplu işleme analizleri yapılmalıdır.
Sonuçları ulaşılabilir ve kusursuz hale getirmek için; açık kaynaklı ve popüler standartlar, web tabanlı mimariler kullanılmalı ve sonuçlar açıkça gösterilmelidir.
Bu yardımcı programlar; Bulut Bilişim, Hadoop, Map Reduce, Google Bigquery.
BÜYÜK VERİ KULLANARAK BİLGİ ÇIKARIMI
BÜYÜK VERİNİN GETİRİLERİ
Maliyetleri azaltma
Zaman tasarrufu
Yeni ürün geliştirme
Şirket içi karar mekanizmalarını
destekleme
BÜYÜK VERİNİN ZORLUKLARI
Verinin büyüklüğü ve yorumlanmasının
zorluğu
Nitelikli personelin azlığı
Eğitim ve teknik bilgi gerekliliği
Yeni donanım ve altyapı ihtiyacı
Yüksek maliyet
Çok fazla raporlama
BÜYÜK VERİNİN KULLANIM ÖRNEKLERİ
Finansal Hizmet Şirketleri Risk analizi ve yönetimi Dolandırıcılık tespiti ve güvenlik analizi CRM ve müşteri sadakat programları Kredi riski ve analizi Yüksel hızlı arbitraj Anormal ticaret örüntü analizi
BÜYÜK VERİNİN KULLANIM ÖRNEKLERİ
Kamu Kuruluşları Dolandırıcılık tespiti, Tehditlerin tespiti, Siber güvenlik, Enerji tüketimi ve karbon ayak izi
yönetimi, Suçla Mücadele,
BÜYÜK VERİNİN KULLANIM ÖRNEKLERİ
Sağlıkla İlgili Kuruluşlar Sağlık sigortası dolandırıcılığı tespiti Kampanya ve satış programlarının
optimizasyonu Marka yönetimi Hasta bakımı kalitesi ve program analizi Tedarik zinciri yönetimi İlaç geliştirme analizi
BÜYÜK VERİNİN KULLANIM ÖRNEKLERİ
Telekomünikasyon Şirketleri Müşterinin başka servis sağlayıcısına
geçmesini önleme Kampanya yönetimi ve müşteri sadakati Arama Detay Kaydı (CDR) analizi Şebeke performansı ve optimizasyonu Mobil Kullanıcı Lokasyon analizi
BÜYÜK VERİNİN KULLANIM ÖRNEKLERİ
UPS ve Büyük Veri 8,8 milyon müşteri için 16,3 milyon paket verisinin takibi Müşterilerden gelen ortalama 39,5 milyon takip talebi 16 petabaytlık veri depolamakta ORION (Yol Üzeri Bütünleşik Optimizasyon ve
Seyrüsefer) projesi: Dünyanın tartışmasız en büyük yöneylem araştırmasıdır.
Proje hâlihazırda 2011 yılında günlük rotaların 85 milyon mil (137 milyon km) yol kısaltılmasıyla 8,4 milyon galon (32 milyon litre) tasarruf sağlamıştır.
UPS, sürücü başına günlük sadece bir millik kısaltmanın şirkete 30 milyon Dolar tasarruf sağlayacağını ve toplam parasal tasarrufun muazzam olacağını tahmin etmektedir.
BÜYÜK VERİ KULLANIM ÖRNEKLERİ
Türk Telekom ile yapılan VERİ ambarı dönüşüm projesi sonucunda Türk Telekom’un 6 milyon Dolar tasarruf etmiştir.
Türk Telekom’un farklı ortamlarda bulunan VERİlerini tek bir ortamda konsolide ederek, daha hızlı ve daha erişilebilir platform oluşturmuştur.
6 ayda gerçekleştirilen bu proje ile tüm VERİye anlık olarak, gerçek zamanlı erişebiliyor.
Bakım ve destek tasarrufu anlamında ise yaklaşık 1 milyon Dolar’ın üzerinde tasarrufunun olduğunu söyleyebiliriz.
BÜYÜK VERİNİN KULLANIM ÖRNEKLERİ
Barack Obama’nın 2012 Seçim ZaferiSosyal medya kampanyalarının başına Rayid Ghani getirildi 13 milyonluk seçmen e-posta adres listesi
BÜYÜK VERİNİN KULLANIM ÖRNEKLERİ
Utah Data Center 2013’ün sonlarında yapımı tamamlanmıştır. NSA (Amerikan Ulusal Güvenlik Teşkilatı)
tarafından uydular, yer altı ve deniz altı kabloları aracılığıyla gerçekleştirilen bütün iletişimleri yakalamak, deşifre etmek ve depolamak için kullanılacaktır.
TEŞEKKÜRLER