Entradas

Trying mom's shoes

Preparándonos para echar a andar.

Con este primer “post” celebramos la apertura de la versión inicial de nuestra web. El primer paso visible de un proyecto que empezó a concebirse hace ya unos seis meses. Nos gustaría explicaros por qué.

EL CONTEXTO

Creamos DIMETRICAL convencidos de estar viviendo una revolución en todas las disciplinas relativas al análisis de datos, revolución que se traduce, a efectos prácticos, en una proliferación sin precedentes de técnicas, métodos y tecnologías cada vez más sofisticados, y lo que es más importante, cada vez más accesibles.

1) Democratización en el acceso a tecnologías avanzadas de tratamiento de datos

En ciclos cada vez más cortos, nuevas tecnologías de tratamiento de datos concebidas experimentalmente en grupos de investigación de Universidades y laboratorios de empresas punteras, dan el salto hasta el gran público a través de proyectos y comunidades Open Source tremendamente activas y vibrantes.

El caso más evidente lo tenemos en la explosión del fenómeno Big Data. Su génesis se remonta a un par de artículos de investigación publicados por los laboratorios de Google (este y este, publicados en 2003/2004), que posteriormente dieron lugar al proyecto Apache Hadoop y su siempre creciente ecosistema. Hadoop ha puesto en manos del gran público tecnología y capacidades de procesamiento de datos masivos que poco antes solo estaban al alcance de “los gigantes” de Internet. Pero apenas hemos terminado de asimilar Hadoop y su modelo de programación distribuida, y ya tenemos aquí a Apache Spark, concebido inicialmente como un proyecto de investigación en los laboratorios de la UC Berkely, con rendimientos entre 10 y 100 veces mayores que los de Hadoop MapReduce y consolidándose rápidamente como la tecnología de procesamiento Big Data preferente con unos ciclos de desarrollo realmente rápidos.

Otro ejemplo muy relevante de tecnología de tratamiento de datos que combina potencia y accesibilidad lo constituye el lenguaje de programación “R“. Gratuito y diseñado desde el inicio como un lenguaje especializado en el tratamiento de datos, “R” ha sufrido en pocos años un crecimiento exponencial, tanto en usuarios como en capacidades, y es tan demandado por las empresas que se ha convertido en el lenguaje mejor pagado del mercado laboral estadounidense.

2) Democratización en el acceso a recursos de computación

De nada sirve disponer del software que permite llevar a cabo procesamientos masivos de datos o análisis avanzados, si no disponemos de máquinas capaces de ejecutarlo. Afortunadamente, hoy en día también esa dificultad es fácilmente salvable a través del Cloud Computing o computación en la nube. Cada vez es más barato “alquilar” máquinas de la potencia que necesitemos en cada momento en “la nube”, disponiendo así de capacidad de proceso casi inmediata, sin ataduras y sin la necesidad de realizar grandes inversiones en adquisición de hardware.

3) Innovación constante en las disciplinas relativas al tratamiento de datos

La imparable digitalización de prácticamente todos los ámbitos de nuestras sociedades modernas, junto con la explosión en la cantidad, diversidad y disponibilidad de datos que conlleva, ha generado una demanda – y por tanto un impulso – tremendos en las disciplinas relativas al tratamiento de datos. El sector de la educación superior no es ajeno a esta tendencia, contando con sus propias especializaciones en la materia, como las disciplinas del Educational Data Mining o Learning Analytics, centradas fundamentalmente en los procesos de enseñanza/aprendizaje, que en los últimos años están siendo objeto de un tremendo impulso.

No obstante, la enseñanza, siendo central, es solo uno de los múltiples procesos que se dan en el seno de una institución de educación superior. La aplicación de técnicas avanzadas de análisis de datos a los muy diversos (y ciertamente complejos) procesos de negocio y realidades de gestión específicas del sector es un campo aun poco explorado y ciertamente muy prometedor.

 

EL PROYECTO

En este contexto, decidimos crear DIMETRICAL. Porque creemos que se dan las condiciones necesarias para que un sector tan crítico como el de la educación superior sea también beneficiario de los avances que hemos descrito, como lo están siendo otros sectores. Con este afán emprendemos nuestra aventura. Con tanto miedo como ilusión. Con tantas ideas como incertidumbres. Con tanta humildad como audacia. Pero siempre con el convencimiento de que – independientemente de lo que nos depare el futuro – el balance será positivo.

El nombre DIMETRICAL proviene de jugar con dos conceptos centrales en el diseño de bases de datos orientadas al análisis: “Dimensión” y “Métrica”. La coletilla “The Analytics Lab” ayuda a describir mejor nuestra identidad:

  • Analytics“, porque nuestra línea preferente son las técnicas y tecnologías innovadoras de análisis avanzado de datos (“Analytics, que no tiene una traducción clara ni directa al Español), más allá de los enfoques tradicionales.
  • Lab“, porque sabemos que en cualquier proyecto innovador de análisis avanzado de datos hay un componente inicial muy relevante de exploración, de establecimiento de hipótesis, de prueba y error, hasta llegar al resultado deseado. El tipo de trabajo que se hace en un laboratorio (“Lab“).

Sin más, empezamos la que hemos denominado “Fase Cero” de nuestro viaje. Aquella destinada a darnos a conocer, a comunicar nuestras propuestas, a validar nuestros enfoques.

¿Nos acompañan?

 

Juan Jesús Alcolea.