Lectura 1 - Big Data Hadoop, Business Analytics and Beyond

4
 BIG DATA HADOOP, BUSINNES ANAL YTICS AND BEYOND Evaluación y selección de herramientas BI. Caso  práctico Powe r Pivot Alumno José Luis Palillero Huerta Profesor de la asignatura Óscar Quero Hijano Lectura 1

Transcript of Lectura 1 - Big Data Hadoop, Business Analytics and Beyond

Page 1: Lectura 1 - Big Data Hadoop, Business Analytics and Beyond

 

 

BIG DATA HADOOP,

BUSINNES ANALYTICS

AND BEYOND 

Evaluación y selección de herramientas BI. Caso

 práctico Power Pivot 

Alumno

José Luis Palillero Huerta

Profesor de la asignaturaÓscar Quero Hijano

Lectura 1

Page 2: Lectura 1 - Big Data Hadoop, Business Analytics and Beyond

 

Actividad 1 : Big data hadoop, businnes analytics and beyond 

Resumen 

Los mercados y las empresas están viviendo una transformación de base tecnológica y social cuyaprincipal derivada es el crecimiento exponencial de datos tanto dentro como fuera de los sistemasempresariales.

Este crecimiento se caracteriza principalmente por estar formado en un 80% de datos noestructurados. Las organizaciones se encuentran ante el reto de capturar, transformar, analizar yalmacenar datos con sistemas tradicionales que no son capaces de resolver esta nuevaproblemática adecuadamente. 

Este nuevo escenario está lleno de retos y oportunidades. Por un lado es marco perfecto para eldespliegue de iniciativas basadas en Big Data. Por otro, es necesario reducir las barreras deadopción en el seno de la organización.  

¿Qué es Big Data? 

Big Data es una nueva generación de tecnologías y arquitecturas diseñadas para extraer valoreconómico de grandes volúmenes de datos heterogéneos habilitando una captura, identificación y/oanálisis a alta velocidad.

Big Data se caracteriza por tener las V’s:

  Volumen: hace referencia a la necesidad de procesamiento intensivo y complejo desubconjuntos de datos de gran tamaño que contienen información de valor para unaorganización mediante tecnologías de Big Data. 

  Variedad: a medida que se multiplican los canales de interacción con clientes, empleados,proveedores y procesos de negocio, la información de valor es cada vez más el resultadode la combinación de datos de múltiple origen y tipología que puede estar en formaestructurada, semiestructurada o no estructurada.

  Velocidad: aunque los ciclos de negocio se han acelerado, no todos los datos de unaorganización tienen la misma urgencia de análisis asociada. La clave para entender en quépunto del espectro de la velocidad es necesario trabajar (desde el procesado en lote hastael flujo de datos continuo) está asociada a los requerimientos de los procesos y los usuarios.  

  Valor : en el contexto de Big Data, valor hacer referencia a los beneficios que se desprendendel uso de Big Data (reducción de costes, eficiencia operativa, mejoras de negocio) 

  Veracidad: los datos deben ser validados y verificados para tener acorde un contexto sobrelo que se requiere el análisis del negocio.

 

 Ilustración 1 Las V's de Big Data 

Page 3: Lectura 1 - Big Data Hadoop, Business Analytics and Beyond

 

Actividad 1 : Big data hadoop, businnes analytics and beyond 

Hadoop 

Hadoop es un framework de trabajo que permite manejar grandes cantidades de información deuna manera eficaz y sencilla mediante el uso de hardware común.  

Hadoop consiste en tres modulos principales:

  Hadoop Common, Módulo de utilidades comunes el cual soporta los demás módulos porlos que está compuesto Hadoop.

  Hadoop Distributed File System (HDFS), Sistema de archivos distribuidos que facilita lagestión de los ficheros y los archivos con un alto grado de fiabilidad y banda ancha, además,es muy económico.

  Hadoop MapReduce  Implementación del algoritmo de procesamiento de datos MapReduce, cuenta con un alto rendimiento y trabaja de manera paralela con los datosdistribuidos a través del HDFS

La parte más importante y con más funcionalidad dentro de Hadoop es el MapReduce, la parteMapReduce es la encargada de tratar los datos del HDFS que se quieren procesar y dar unosresultados. 

 Ilustración 2 Arquitectura hadoop fases map & reduce 

Big Data Analytics

Es una nueva herramienta empresarial la cual nos permitirá examinar grandes repositorios de datosde Big Data, con el objetivo de ayudar en la toma de decisiones descubriendo patrones ocultos,correlaciones desconocidas, predicciones y otra información útil y así permitir lograr ventajascompetitivas para las empresas u organizaciones que lo posean.  

El objetivo principal de Big Data Analytics es ayudar en la toma de decisiones de negocio al permitiranalizar grandes volúmenes de datos de bases de datos transaccionales, así como otras fuentesde datos que pueden quedar sin explotar por la inteligencia de negocio (BI)  

Big Data Analytics si solo analizaría bases de datos estructuradas se podría realizar herramientasmás conocidas de análisis predictivo y minería de datos. No obstante como también recoge datosde fuentes no estructuradas o semi-estructuradas. Como resultado, una nueva clase de tecnología.Las tecnologías relacionadas con Big Data Analytics incluyen NoSQL bases de datos, Hadoop yMapReduce . 

Page 4: Lectura 1 - Big Data Hadoop, Business Analytics and Beyond

 

Actividad 1 : Big data hadoop, businnes analytics and beyond 

Conclusión 

Big Data, Hadoop, BA suponen un proceso de cambios en la organización, no sólo desde laperspectiva tecnológica sino principalmente desde la de negocio.

La explotación de datos anteriormente inabordable habilita no sólo una mayor comprensión delnegocio, sino también proporciona la capacidad de reimaginar los servicios que se ofrecen.

De hecho, Big Data representa una oportunidad para que desde el departamento TI se impacte enel negocio de forma realmente significativa.

El CIO debe liderar la adopción de un conjunto de tecnologías – como lo es Big Data, Hadoop,Business Analytics – y de mejores prácticas para extraer valor de los datos, para lo que seránecesario redefinir nuevas funciones y realizar un rediseño organizacional. En particular, se necesitade nuevos roles como el del científico del dato (data science). La falta de talento es uno de losobstáculos de las organizaciones que van a tener de apoyarse en los servicios de terceros.