Pentaho OSBI - Consorcio SIU
-
Upload
marcos-pierri -
Category
Technology
-
view
3.997 -
download
0
description
Transcript of Pentaho OSBI - Consorcio SIU
Pentaho BI Suite Pentaho BI Suite IntroducciónIntroducción
SIU – Datawarehouse / Agosto 2010
“Inteligencia de Negocios es el proceso de convertir datos en conocimientos y el
conocimiento en acción, para la toma de decisiones”
Business IntelligenceBusiness Intelligence
DATOS
ANÁLISIS
CONOCIMIENTO
SIU – Datawarehouse / Agosto 2010
Fases de un proceso BIFases de un proceso BI
SIU – Datawarehouse / Agosto 2010
Pentaho OSBIPentaho OSBIOpen Source Business IntelligenceOpen Source Business Intelligence
SIU – Datawarehouse / Agosto 2010
Proyecto Open Source (GNU GPL) cuyo objetivo es crear soluciones para Inteligencia de Negocios.
Las funcionalidades principales son: Reporting empresarial y Análisis. Tableros de mando. Minería de datos. Integración de datos. Workflow, alertas, suscripciones, etc.
¿Qué es Pentaho? (1/2)¿Qué es Pentaho? (1/2)
SIU – Datawarehouse / Agosto 2010
Plataforma “orientada a la solución” y “centrada en procesos”.
Compuesto por múltiples programas que trabajan juntos para crear y distribuir soluciones BI. (diferentes funcionalidades).
Puede ser accedido desde un simple web browser, embebido en portales (LifeRay), embebido en sistemas de gestión (Alfresco).
Su diseño modular le permite utilizar otros programas ajenos a la suite (BIRT, Jasper).
¿Qué es Pentaho? (2/2)¿Qué es Pentaho? (2/2)
SIU – Datawarehouse / Agosto 2010
PrincipalesPrincipales proyectosproyectos
Pentaho Reporting (antes JFreeReport):http://reporting.pentaho.org
Pentaho Data Integration (Kettle): http:// kettle.pentaho.org
Pentaho Analysis (Mondrian OLAP server):http:// mondrian.pentaho.org
Pentaho Data Mining (Weka): http:// weka.pentaho.org
Pentaho Dashboards (CDF):http://www.pentaho.com/products/dashboards/
Pentaho BI Platform:http:// community.pentaho.com/projects/bi_platform/
SIU – Datawarehouse / Agosto 2010
Análisis OLAPAnálisis OLAP
SIU – Datawarehouse / Agosto 2010
GráficosGráficos
SIU – Datawarehouse / Agosto 2010
Tableros de mandoTableros de mando
SIU – Datawarehouse / Agosto 2010
ReportesReportes
SIU – Datawarehouse / Agosto 2010
Componentes (1/3)Componentes (1/3)
Plataforma 100% J2EE, asegurando la escalabilidad, integración y portabilidad.
Servidor: puede correr en servidores compatibles con J2EE como JBOSS AS, WebSphere, Tomcat, WebLogic y Oracle AS.
Base de datos: vía JDBC, IBM DB2, Microsft SQL Server, MySQL, Oracle, PostgreSQL, NCR Teradata, Firebird, etc.
SIU – Datawarehouse / Agosto 2010
Componentes (2/3)Componentes (2/3)
Sistema operativo: no hay dependencia. Lenguaje interpretado.
Lenguaje de programación: Java, Javascript, JSP, XSL (XSLT/XPath/XSL-FO).
Interfaz de desarrollo: Java SWT, Eclipse, Web-based.
Repositorio de datos basado en XML.
Todos los componentes están expuestos vía Web Services para facilitar la integración con Arquitecturas Orientadas a Servicios (SOA).
SIU – Datawarehouse / Agosto 2010
ArquitecturaArquitectura
SIU – Datawarehouse / Agosto 2010
Existen dos versiones disponibles de PentahoExisten dos versiones disponibles de Pentaho
Pentaho Community EditionPentaho Community Edition
Pentaho Enterprise Edition (*)Pentaho Enterprise Edition (*)
(*) (Costo de soporte 10.000 US$/año hasta 25 usuarios – 1º semestre 2010)http://repositorio.siu.edu.ar/trac/datawarehouse/attachment/wiki/Información%20de%20interés/lower%20costs%20with%20OSBI.pdf
SIU – Datawarehouse / Agosto 2010
Versión Comunitaria
Sin costos de licencia
Sin servicios de soporte asociados
Suite completa con todas las funcionalidades para el desarrollo de proyectos de Business Intelligence.
Aunque Pentaho soló la recomienda para: Aficionados al BI Académicos Programadores de Software Abierto
Pentaho Community EditionPentaho Community Edition
SIU – Datawarehouse / Agosto 2010
Versión Empresarial.
Sin costos de licencia.
Costo de soporte y mantención con suscripción anual.
Versión certificada con funcionalidades mejoradas para la consola de administración, y la construcción de tableros de control.
Pentaho Enterprise EditionPentaho Enterprise Edition
SIU – Datawarehouse / Agosto 2010
¿Community ó Enterprise?¿Community ó Enterprise?
http://www.pentaho.com/download/asset_container.php?durl=pentaho_bi_suite_enterprise_edition.pdf&furl=540000
SIU – Datawarehouse / Agosto 2010
http://www.pentaho.com/download/asset_container.php?durl=pentaho_bi_suite_enterprise_edition.pdf&furl=540000
¿Community ó Enterprise?¿Community ó Enterprise?
SIU – Datawarehouse / Agosto 2010
http://www.pentaho.com/download/asset_container.php?durl=pentaho_bi_suite_enterprise_edition.pdf&furl=540000
¿Community ó Enterprise?¿Community ó Enterprise?
SIU – Datawarehouse / Agosto 2010
¿Dónde conseguir ayuda ?¿Dónde conseguir ayuda ?
Web principal: Web principal: http://http://www.pentaho.comwww.pentaho.com
Descarga de: Descarga de: http://http://sourceforge.netsourceforge.net//projectsprojects//pentahopentaho
Material comunitario: Material comunitario: http://community.pentaho.comhttp://community.pentaho.com
Wiki Comunidad: Wiki Comunidad: http://wiki.pentaho.com/display/COM/Community+Wiki+Homehttp://wiki.pentaho.com/display/COM/Community+Wiki+Home
Foros Comunidad: Foros Comunidad: http://forums.pentaho.org/http://forums.pentaho.org/
Wiki - SIU-Datawarehouse:Wiki - SIU-Datawarehouse: http://repositorio.siu.edu.ar/trac/datawarehousehttp://repositorio.siu.edu.ar/trac/datawarehouse
SIU – Datawarehouse / Agosto 2010
Suites BISuites BI
Pentaho Community Edition (CE): Aplicación web desarrollada en J2EE. Modular. Multiplataforma. Incluye: ETL, Reporting, OLAP, Data mining, Dashboards. GNU GPL.
OpenI: Aplicación de tipo SaaS. Desarrolada en J2EE. Multiplataforma. Incluye: OLAP. Licencia Open Source.
SIU – Datawarehouse / Agosto 2010
SpagoBI:Aplicación web desarrollada en J2EE. Modular.Multiplataforma.Incluye: ETL, Reporting, OLAP, Data mining, Dashboards.Licencia GNU LGPL.
JasperSoft Community Edition:Aplicación de tipo SaaS. Modular. Multiplataforma.Incuye: ETL, Reporting, OLAP, Dashboards.Licencia GNU GPL.
Suites BISuites BI
SIU – Datawarehouse / Agosto 2010
Palo Community Version:Orientada a Planificación y Presupuestos. Basada enAJAX. Multiplataforma.Incluye: ETL, Reporting, OLAP.Licencia Open Source.
Suites BISuites BI
SIU – Datawarehouse / Agosto 2010
Pentaho Data Integration Pentaho Data Integration (PDI) - Kettle(PDI) - Kettle
SIU – Datawarehouse / Agosto 2010
SIU – Datawarehouse / Agosto 2010
Usos comunesUsos comunes
Carga de datawarehouses y datamarts.
Integración de datos.
Limpieza de datos (Data cleansing).
Migración y depuración de datos.
Exportación de datos.
Integración de PDI usando Pentaho BI.
...
Introducción (1/2)Introducción (1/2)
SIU – Datawarehouse / Agosto 2010
Pentaho Data Integration (PDI) - Kettle → Kettle Extracción, Transformación, y Carga.
Licencia GNU LGPL.
Las soluciones de PDI se basan en dos tipos de objetos diferentes: Transformaciones Trabajos
PDI cuenta con un Motor propio que le permite interpretar, planificar y ejecutar Transformaciones y Trabajos (T&T).
Introducción (2/2)Introducción (2/2)
SIU – Datawarehouse / Agosto 2010
Transformación (transformation)Transformación (transformation) Orientación a los Datos. Representa una tarea ETL.
Es una colección de “pasos”. Cada paso es una operación particular sobre datos.
Los “pasos” se conectan entre sí a través de “saltos”, que indica cual será el flujo de los datos.
Los “pasos” trabajan de manera simultánea y asincrónica.
SIU – Datawarehouse / Agosto 2010
Trabajo (job)Trabajo (job) Orientación a la Tarea y a los Datos.
Usualmente un Trabajo se compone de una o más Transformaciones, que serán ejecutadas secuencialmente.
La ejecución de cada “Entrada de Trabajo” presenta una salida de status, que puede ser analizada para la realización de diferentes acciones.
SIU – Datawarehouse / Agosto 2010
PDI cuenta con herramientas y utilidades para crear, administrar y ejecutar T&T:
Spoon: IDE gráfico para crear T&T.
Kitchen: herramienta de línea de comandos para ejecutar Trabajos.
Pan: herramienta de línea de comandos para ejecutar Transformaciones.
Carte: servidor liviano para ejecutar T&T en host remotos.
Las T&T utilizan un lenguaje descriptivo (XML), el cual será interpretado por el Data Integration Engine para su ejecución.
PDI - Aplicaciones PDI - Aplicaciones
SIU – Datawarehouse / Agosto 2010
“Sin Catálogo”: se almacenan y gestionan las T&T en algún directorio.“Con Catálogo”: se utiliza una BD Relacional para almacenar y gestionar T&T.
CatálogoCatálogo
SIU – Datawarehouse / Agosto 2010
Kettle en el proceso de BIKettle en el proceso de BI
SIU – Datawarehouse / Agosto 2010
Data Integration EngineData Integration Engine
Responsable de interpretar y ejecutar los T&T de PDI.
Data Integration Engine utiliza: Para Transformaciones → Motor de Transformaciones Para Trabajos → Motor de Trabajos
Implementado como una librería Java.
Cuenta con una GUI muy avanzada.
Incluido en Pentaho BI server, para permitir ejecutar Trabajos como parte de una xaction.
SIU – Datawarehouse / Agosto 2010
Transformación (transformation)Transformación (transformation)
Ejemplo:Ejemplo:
SIU – Datawarehouse / Agosto 2010
Trabajo (job)Trabajo (job) Ejemplo: Carga de un DWEjemplo: Carga de un DW
SIU – Datawarehouse / Agosto 2010
Interfase gráficaInterfase gráfica
SIU – Datawarehouse / Agosto 2010
DemoDemo
SIU – Datawarehouse / Agosto 2010
Web: Web: http://http://kettle.pentaho.orgkettle.pentaho.orgForo: Foro: http://http://forums.pentaho.org/forumdisplay.php?fforums.pentaho.org/forumdisplay.php?f=69=69Wiki: Wiki: http://http://wiki.pentaho.orgwiki.pentaho.org/display/EAI/display/EAILista de mails: Lista de mails: http://http://groups.google.comgroups.google.com/group/kettle-developers/group/kettle-developersManual de Spoon en español: Manual de Spoon en español: http://http://wiki.pentaho.comwiki.pentaho.com/display//display/
EAIesEAIes/Manual+del+Usuario+de+/Manual+del+Usuario+de+SpoonSpoonDocumentación en español: Documentación en español: http://wiki.pentaho.com/display/EAIes/Iniciohttp://wiki.pentaho.com/display/EAIes/Inicio Libros: Libros:
Pentaho 3.2 Data Integration - Beginner's Guide. Pentaho 3.2 Data Integration - Beginner's Guide. Pentaho Solutions: Business Intelligence and Data Warehousing with Pentaho Solutions: Business Intelligence and Data Warehousing with Pentaho and MySQL.Pentaho and MySQL. Pentaho Kettle Solutions - Building Open Source ETL Solutions with Pentaho Kettle Solutions - Building Open Source ETL Solutions with Pentaho Data Integration. Pentaho Data Integration.
Donde obtener informaciónDonde obtener información
SIU – Datawarehouse / Agosto 2010
BibliografíaBibliografía Roland Bouman, Jos van Dongen, 2009. “Pentaho Solutions: Business Roland Bouman, Jos van Dongen, 2009. “Pentaho Solutions: Business
Intelligence and Data Warehousing with Pentaho and MySQL”. Wiley Intelligence and Data Warehousing with Pentaho and MySQL”. Wiley
Publishing, Inc.Publishing, Inc. María Carina Roldan, 2010. “Pentaho 3.2 Data Integration - Beginner's María Carina Roldan, 2010. “Pentaho 3.2 Data Integration - Beginner's
Guide”. Packt Publishing.Guide”. Packt Publishing. Ing. Bernabeu Ricardo Dario, 2010. “DATA WAREHOUSING:Investigación y Ing. Bernabeu Ricardo Dario, 2010. “DATA WAREHOUSING:Investigación y
Sistematización de Conceptos – HEFESTO: Metodología propia para la Sistematización de Conceptos – HEFESTO: Metodología propia para la
Construcción de un Data Warehouse”. Construcción de un Data Warehouse”. http://http://tgxtgx--hefesto.blogspot.comhefesto.blogspot.com/2010/07//2010/07/hefestohefesto-v20.-v20.htmlhtml Matt Casters. Pentaho Data Integration 4 and MySQL.. MySQL User Matt Casters. Pentaho Data Integration 4 and MySQL.. MySQL User
Conference, Tuesday April 13th , 2010.Conference, Tuesday April 13th , 2010. http://http://community.pentaho.comcommunity.pentaho.com http://http://kettle.pentaho.orgkettle.pentaho.org http://http://todobi.blogspot.comtodobi.blogspot.com
SIU – Datawarehouse / Agosto 2010
¿Preguntas?¿Preguntas?
SIU – Datawarehouse / Agosto 2010
Muchas Gracias!!!Muchas Gracias!!!
SIU – Datawarehouse / Agosto 2010