Business Analytics en Knime

Categorías: Knime

En un momento en que las compañías en muchas industrias ofrecen productos similares y usan tecnologías similares, los procesos de negocios se encuentran entre las pocas cosas restantes de diferenciación, y aquellos competidores que usan BA retienen cada última gota de valor de esos procesos. Dentro de las compañías que compiten en BA, los altos ejecutivos dejan claro, desde arriba hacia abajo, que BA es fundamental para la estrategia. Dichas organizaciones lanzan múltiples iniciativas que involucran datos complejos y análisis estadísticos, y la actividad cuantitativa se administra a nivel empresarial (no departamental)[1].

BA puede ser interpretado como el análisis autónomo o semi-autónomo de datos o de contenido que utiliza técnicas y sofisticadas herramientas estadísticas, generalmente más allá de las de que usa el BI tradicional, para descubrir información más detallada, realizar predicciones o generar recomendaciones. Las técnicas analíticas avanzadas incluyen aquellas tales como: minería de datos/texto, aprendizaje automático, comparación de patrones, previsión, visualización de datos, análisis semántico, análisis de sentimientos, análisis de redes y cluster, simulación de escenarios, procesamiento complejo de eventos, redes neuronales y entre otros. BA tiene la capacidad de responder a preguntas como: qué sucedió, por que está pasando, con qué frecuencia pasa, dónde está el problema y qué acciones son necesarias[2][3].

Sin duda, la principal locomotora que impulsa la aplicación de BA en las empresas es la extracción de datos o el descubrimiento de conocimientos en bases de datos. Al aplicar la minería de datos, el profesional de análisis de negocios actúa como un detective de datos, analiza los datos para comprender mejor la situación actual y pasada de una compañía, predecir resultados futuros que permitan actuar con eficacia.

CRISP-DM (Cross-Industry Process for Data Mining)

Actualmente no existe procedimientos estándar para llevar a cabo proyectos de minería de datos. Esto significa que el éxito o fracaso de un proyecto dependen de la persona o equipo lo ejecute, donde, no necesariamente aquellas practicas exitosas pueden ser replicadas en toda la compañía. La minería de datos requiere de procedimientos estándar que ayuden a traducir los problemas de negocio en tareas de minería de datos, sugiera transformaciones de datos y técnicas estadísticas adecuadas que proporcionen medios para evaluar la efectividad de los resultados y documentar experiencias. CRISP-DM aborda partes de estos problemas mediante la definición de un modelo de procesos que proporcionan un entorno para llevar a cabo proyectos de minería de datos independientes tanto del sector industrial como de la tecnología que este sinedo utilizada. CRISP-DM ayuda a hacer de los grandes proyectos de minería de datos, menos costosos, más confiables, más replicables, más manejables y más eficientes. CRISP-DM incluye un modelo y una guía, estructurados en seis fases, algunas de las cuales son bidireccionales, es decir, de una fase se puede volver a otra anterior para revisarla, por lo que la sucesión de fases no tiene porqué ser ordenada desde la primera hasta la última[4][5].

Knime

Desarrollada en la universidad de Konstanz entre los años 2004 y 2006 Knime es una de las plataformas líderes a nivel mundial que está alineada con el proceso estándar para minería de datos (CRISP-DM). Knime es una plataforma de análisis, generación de informes e integración de datos de código abierto adoptada por más de 100.000 usuarios en todo el mundo.

Knime integra varios componentes para machine learning y minería de datos a través de su concepto de flujos de datos (o pipelines). Su interfaz gráfica permite a los usuarios (con o sin conocimientos de programación) entrelazar cientos de nodos para diferentes propósitos como por ejemplo:

  • Lectura, procesamiento y transformación de datos.
  • Análisis de datos.
  • Visualización de datos.
  • Interacción con otras herramientas como R, Python y Weka.

además, es posible ejecutar de manera selectiva algunos o todos nodos de los pasos analíticos y luego inspeccionar los resultados, modelos y vistas interactivas. En la figura a continuación presentamos un ejemplo de un proceso CRISP-DM implementado en Knime.

AnalyStats ofrece servicios de consultoría con Knime en:

  • Instalación y configuración
  • Diseño de arquitectura.
  • Formación de personal.
  • Implementación de modelos y adaptación modelos existentes.
  • Análisis descriptivos y de diagnostico.
  • Análisis predictivo y prescriptivo.
Contacto a AnalyStats

Referencias

[1] Davenport, Thomas H.; Harris, Jeanne G. (2007). Competing on analytics: the new science of winning. Boston, Mass.: Harvard Business School Press. ISBN 978-1-4221-0332-6.

[2] Beller, Michael J.; Alan Barnett (2009-06-18). Next Generation Business Analytics., Lightship Partners LLC. Retrieved 2009 06-20.

[3] Gartner Glossary/ Advanced Analytics.

[4] Galán Cortina V. (2015). Aplicación de la metodología CRISP-DM a un proyecto de minería de datos en el entorno universitario: Link.

[5] Wirth, R.; Hipp, J. (2000). CRISP-DM: Towards a Standard Process Model for Data Mining. Proceedings of the 4th International Conference on the Practical Applications of Knowledge Discovery and Data Mining., (pp. 29-39).

[6] PuiMun L (2013). Use of data mining in business analytics to support business Competitiveness, Review of Business Information Systems-Second Quarter, Volume 17, Number 2.

[7] Zeutschler T (2016). It applications in business analytics, Hochschule Düsseldorf, Lecture 05 – Introduction to KNIME: Link.

Traducciones

Ver también