Saber “lo que dicen los datos” a partir de su tratamiento

Daniel Gutiérrez Pachas
Doctor en Ciencia de la Computación
Investigador asociado del Dpto. de Ciencia de la Computación – UCSP

El avance de la tecnología ha mejorado la manera de recolectar datos, pero a medida que la información aumenta se hace cada vez más complejo organizarlos, manipularlos y comunicarlos. Diversos investigadores coinciden que la Ciencia de Datos es determinante para comprender grandes cantidades de ellos. Sus aplicaciones son diversas, varias de ellas han sido exitosas para comprender modelos sociales, económicos, entre otros. La crisis sanitaria provocada por el COVID-19 no ha sido la excepción en esto. 

La actual pandemia ha dejado en evidencia la importancia de datos confiables con la finalidad de tomar decisiones adecuadas que lleven a controlar el contagio de manera eficiente. Las decisiones, que van desde asumir medidas de aislamiento social, fortalecimiento de los servicios en los centros de salud, apoyo social a personas vulnerables, entre otras, se toman desde la Ciencia de Datos. Incluso ahora con la disminución de los índices, los datos seguirán siendo importantes para la toma de decisiones en la reactivación económica.

La Ciencia de Datos es un campo multidisciplinar. Requiere el dominio de una variedad de habilidades y conceptos, incluidos muchos tradicionalmente asociados con los campos de Estadística, Matemáticas y  Ciencia de la Computación. No se trata de la intersección de estas áreas sino de una integración efectiva de ellas. Por ejemplo, conceptos provenientes del  Álgebra Lineal, Cálculo, Optimización y Probabilidades son tópicos que son ampliamente usados en Ciencia de Datos.

El trabajo estadístico en el tratamiento de datos busca darle sentido a la información para extraer patrones y tendencias importantes. Este esfuerzo comprende desde el análisis descriptivo de los datos, así como el análisis e interpretación de cuadros y gráficos estadísticos, además de técnicas de regresión aplicadas eficientemente en modelos predictivos. 

La validación de nuestras conclusiones son pruebas de inferencia estadística. Otro aporte de la Estadística son los modelos probabilísticos y bayesianos y que ayuda a comprender situaciones inciertas. También se estudian modelos para encontrar relaciones entre acciones y consecuencias como modo de comprender una situación y adaptarse a la misma, que son bien interpretadas usando modelos de causalidad.

El Departamento de Ciencia de la Computación de la UCSP desarrolla investigaciones en este campo. Uno de los proyectos es el de “Ciencia de Datos en la Educación”, el cual fue ganador de una convocatoria del Consejo Nacional de Ciencia, Tecnología e Innovación Tecnológica con fondos del Banco Mundial. Allí analizamos grandes volúmenes de datos usando métodos computacionales para detectar y prevenir la deserción universitaria. Realizamos el análisis de datos socioeconómicos para identificar a los estudiantes con riesgo de desertar y las causas de dicha decisión. 

Otra iniciativa es el Monitor COVID-19, portal web que desde el inicio de la pandemia en nuestro país, ofrece las cifras del coronavirus en el país, las cuales son analizadas para poder ser presentadas de modo más amigable aprovechando distintas herramientas de visualización a fin de entender de mejor manera la incidencia del virus a través de los datos y las gráficas tanto a nivel nacional como por regiones (cs.ucsp.edu.pe/monitor-covid/).

En el ámbito académico brinda los diplomados de posgrado en Business Analytics y en Data Science. En ellos se imparten fundamentos estadísticos, además de otros cursos relacionados a Ciencia de la Computación para que más personas tengan la oportunidad de entender, aplicar y aprovechar las ventajas que ofrece la Ciencia de Datos.

Salir de la versión móvil