Inteligencia de datos (A1C13C2D03)

Introducción

Cualquier Organización produce datos de manera intensiva en su operativa diaria. Aprovechar correctamente los mismos almacenándolos, analizándolos y construyendo modelos predictivos puede aportar una visión en tiempo real del desempeño de la organización, medir su eficacia, optimizar procesos y tomar decisiones de planificación que mejoren sus carencias y aprovechen sus fortalezas de una Organización.

La Inteligencia de negocio permite la definición de estrategias empresariales a corto, medio y largo plazo basadas en la información externa e interna que una empresa puede almacenar, procesar y analizar. Este tipo de software se conoce como Sistemas de Ayuda a la Toma de Decisiones.

VÍDEO

EXPLORANDO LA INTELIGENCIA DE DATOS

Definición de Sistema de Información, obtención de datos, principales tipos de Sistema de Información, formatos de exportación y crawling de datos.

e.digitall.org.es/A1C13C2V05

Los Sistemas de Ayuda a la toma de decisiones se apoyan en los Sistemas de Información de las Organizaciones. El siguiente vídeo recoge información sobre los Sistemas de Información.

VÍDEO

TOMA DE DECISIONES BASADA EN DATOS

Importancia de la toma de decisiones y su automatización. Toma de decisiones en tiempo real vs puntual. Herramientas de toma de decisiones. Modelado de flujos de procesamiento de datos y aplicaciones.

e.digitall.org.es/A1C13C2V06

Herramientas de Escritorio

Algunas de las herramientas de toma de decisiones más empleadas para escritorio son KNIME y ProM Tools. Describimos, a continuación, algunas de sus características.

KNIME (KoNstanz Information MinEr) es una plataforma gratuita de escritorio para minería de datos que, en su versión comercial, ha evolucionado a un entorno desplegable en cloud. La plataforma permite la automatización de flujos de tareas en multitud de ámbitos de aplicación.

KNIME permite construir modelos de aprendizaje utilizando un entorno visual desarrollado con el Interfaz de Desarrollo de Aplicaciones JAVA-Eclipse. La herramienta permite la confección de flujos de trabajo mediante nodos (que encapsulan distintos tipos de algoritmos) y flechas (que representan flujos de datos) que se despliegan y se pueden combinar interactivamente. Una vez leídos los datos con nodos específicos para fuentes muy variadas como XML, CSV o conexiones al API se pueden realizar con otros nodos especializados manipulaciones de los datos para su preprocesamiento, análisis estadístico y creación de modelos predictivos.

El sencillo interfaz de KNIME ha facilitado su uso a profesionales no relacionados con el ámbito de la informática y se utiliza en investigación farmacéutica e inteligencia de negocio.

La herramienta ProM es un entorno para minería de procesos orientado a la extracción de  conocimiento sobre un proceso de negocio a partir de los datos que se producen (logs) en su ejecución.

La herramienta es extensible, gratuita, y está implementada en lenguaje Java. Esto facilita su extensión y aplicación a dominios concretos mediante el desarrollo de plugins.

Herramientas Cloud

La computación en la nube proporciona un ecosistema para el despliegue de aplicaciones que proporciona muchos beneficios en cuanto a capacidad computacional, escalabilidad, ratio coste beneficio y reducción de la huella de carbono. Los proveedores más importantes son Amazon AWS, Azure y Google. Para más información puedes consultar el siguiente video.

VÍDEO

ALMACENAMIENTO ONLINE Y EN LA NUBE

Definición de almacenamiento en la nube. Tipos de nube. Tipos de provisionamiento de servicios y aplicaciones según el nivel de control que alcanza el proveedor (IaaS, SaaS, PaaS). Almacenamiento online. Principales proveedores y diferencias en los modelos que ofrecen.

e.digitall.org.es/A1C13C2V03

En este contexto, existen servicios proporcionados por los proveedores para el despliegue de aplicaciones que permitan escalar de forma adecuada sistemas de ayuda a la toma de decisiones. Comentamos a continuación los más relevantes en cuanto a impacto

Google Dataproc es un servicio para ejecutar Apache Hadoop, Apache Spark, Apache Flink, Presto y multitud de herramientas software libre. El despliegue de soluciones para la ayuda a la toma de decisiones se puede realizar de forma segura a escala mundial e integrada con Google Cloud con coste reducido.

Figura 1. Google DataProc

Figura 1. Google DataProc. Fuente: Imagen con licencia CCC obtenida de Wikimedia.

BigQuery es un entorno cloud para el almacenamiento escalable de datos y que tiene como principal dominio de aplicación los Sistemas de Ayuda a la Toma de Decisiones de tipo empresarial. El entorno utiliza funciones integradas de Inteligencia artificial orientadas a la Inteligencia de Negocio y permite despliegues de estos sistemas a gran escala.

Saber más

La industria de la computación en la nube ha crecido con una enorme rapidez. La elección de la solución más adecuada puede resultar compleja, dado que existen multitud de opciones y, además, cada proveedor utiliza una terminología distinta, con lo que la toma de decisiones acerca de qué plataforma cloud utilizar y qué tipo de despliegue realizar puede resultar un proceso muy complejo.

Puedes tener más información en el siguiente enlace: kinsta.com/blog/aws-vs-azure/