Softwarelibre para Business Intelligence: Pentaho
¿que es Pentaho? Es un conjunto de programas libres para generar inteligencia empresarial (Business Intelligence). Incluye herramientas integradas para generar informes, minería de datos, ETL, etc.
Pasos para instalarlo en tu PC:
1) Descarga el programa en http://sourceforge.net/projects/pentaho/
Se descarga un archivo .zip.
Nota: su tamaño es considerable 581 MB (versión 5.2.0.0)
2) Descomprimimos este archivo, y se crea una carpeta llamada llamada data-integration, con varios script. Estos script son los encargados de llamar a las herramientas de Pentaho.
3) Para ejecutar, por ejemplo, el módulo Kettle (es la herramienta de integración de dato), para realizar operaciones de Extracción, Transformación y carga (ETL), se ejecuta el script spoon.sh de la carpeta data-integration.
$cd data-integration
$./spoon.sh
Nota:
Hay que tener instalado java, para que funcione el programa
$sudo apt-get install openjdk-7-jre
Os dejo aqui un video del proceso de instalación:
En el enlace nº 1, de las fuentes de este artículo, se explica un ejemplo de extracción de datos de rss.
Os dejo unos cuantos videos que he encontrado en youtube:
Introducción y demo:
(enlace:
Pentaho Report Designer, Inicando, PRD
Uso Herramienta Pentaho Data Integration
Como crear un cubo con Pentaho y MySql
Fuentes:
1) https://leninmhs.wordpress.com/2013/09/29/pentaho-kettle-debian-wheezy (incluye ejemplo de extracción de datos)
2) http://es.wikipedia.org/wiki/Pentaho
3) http://mixelaneo.blogspot.com.es/2012/07/aprender-pentaho-data-integration-kettle.html