Páginas

viernes, 13 de febrero de 2015

Softwarelibre para Business Intelligence: Pentaho


Softwarelibre para Business Intelligence: Pentaho



¿que es Pentaho? Es un conjunto de programas libres para generar inteligencia empresarial (Business Intelligence). Incluye herramientas integradas para generar informes, minería de datos, ETL, etc.

Pasos para instalarlo en tu PC:
1) Descarga el programa en http://sourceforge.net/projects/pentaho/
Se descarga un archivo .zip.
Nota: su tamaño es considerable 581 MB (versión 5.2.0.0)

2) Descomprimimos este archivo, y se crea una carpeta llamada llamada data-integration, con varios script. Estos script son los encargados de llamar a las herramientas de Pentaho.

3) Para ejecutar, por ejemplo, el módulo Kettle (es la herramienta de integración de dato), para realizar operaciones de Extracción, Transformación y carga (ETL), se ejecuta el script spoon.sh de la carpeta data-integration.

$cd data-integration
$./spoon.sh

Nota:
Hay que tener instalado java, para que funcione el programa
$sudo apt-get install openjdk-7-jre

Os dejo aqui un video del proceso de instalación:



En el enlace nº 1, de las fuentes de este artículo, se explica un ejemplo de extracción de datos de rss.



Os dejo unos cuantos videos que he encontrado en youtube:

Introducción y demo:

(enlace:

Pentaho Report Designer, Inicando, PRD




Uso Herramienta Pentaho Data Integration


Como crear un cubo con Pentaho y MySql



Fuentes:
1) https://leninmhs.wordpress.com/2013/09/29/pentaho-kettle-debian-wheezy (incluye ejemplo de extracción de datos)
2) http://es.wikipedia.org/wiki/Pentaho
3) http://mixelaneo.blogspot.com.es/2012/07/aprender-pentaho-data-integration-kettle.html