Internet, los dispositivos móviles y las redes sociales hacen que el material disponible aumente exponencialmente, de ahí que la ciencia de datos cobre relevancia. Por ello, se requieren cada vez más personas especializadas en su manejo y capacitadas en indagación y docencia en el rubro, señaló Sergio Rafael Coria Olguín, investigador visitante en el Centro de Ciencias de la Atmósfera. (México)
«Es una especialidad cada vez más necesaria en la academia, gobierno y empresas, pues en cada una de estas áreas los volúmenes de información crecen constantemente.»
Los países desarrollados, subrayó, tienen centros especializados en esta disciplina, los que han demostrado su valía al momento de diseñar políticas públicas, expuso. «Urge crear espacios similares en México –universitarios o independientes–, pues sus aportes permitirían entender mejor los problemas sociales, económicos y de salud, y generar investigación multidisciplinaria», dijo.
Detalles
Esta ciencia consiste en aplicar metodologías provenientes de la ingeniería en computación y la estadística para analizar grandes volúmenes de información (bases de datos). El objetivo es descubrir patrones significativos con utilidad práctica.
Los análisis y modelos derivados tienen diversas aplicaciones, como en el Centro de Ciencias de la Atmósfera, donde se emplean para investigar el clima; en instancias gubernamentales, para analizar programas de asistencia, estrategias de apoyo en desastres naturales y supervisión de recursos públicos, y en bancos y empresas con propósitos mercadológicos y de optimización de procesos.
Al respecto, Coria Olguín mencionó que hay dos categorías de datos: estructurados y no estructurados. Los primeros se organizan en tablas, como las empleadas en sistemas informáticos para cobrar impuestos, derechos y servicios. Los segundos se integran de volúmenes de texto, videos, audios o fotografías descargables de la web. En esta labor, la especialidad se apoya en metodologías de ciencia e ingeniería de la computación, así como en estadística y matemáticas.
«Por ejemplo, en seguridad pública permite identificar patrones en la ocurrencia de delitos (por ejemplo, homicidios y secuestros) para establecer políticas públicas, programas y estrategias para su prevención o combate. En el mundo de los negocios es útil para descubrir recurrencias en características y hábitos de consumo, así como expectativas de pago de clientes actuales y potenciales.»
Brecha digital
Coria Olguín, investigador visitante de la Universidad de la Sierra Sur de Miahuatlán de Porfirio Díaz, Oaxaca, ha dedicado los últimos años a aplicar la ciencia de datos para entender cómo se configura la brecha digital en México, es decir, las diferencias en el grado de presencia y uso de las tecnologías de la información y comunicación (TIC) entre los municipios.
En esta labor usó datos del Censo de Población 2010 del Instituto Nacional de Estadística y Geografía y mediante técnicas de inteligencia artificial –específicamente árboles clasificadores, con variables sociodemográficas– obtuvo modelos que describen la situación actual del país.
Al comparar a México con naciones desarrolladas, presenta un rezago considerable en presencia y aprovechamiento de las TIC, y en el ámbito interno se observan atrasos significativos en las entidades del sur y sureste (Guerrero, Oaxaca, Chiapas) respecto de las del centro (Distrito Federal) y del norte (Nuevo León).
A partir de los resultados obtenidos, publicó el año pasado el artículo «CT4RDD: Classification Trees for Research on Digital Divide», en la revista Expert Systems with Applications, en el que presentó reglas en forma de inferencias lógicas que describen cómo interactúa esta brecha con las características poblacionales y de vivienda en los municipios mexicanos.
«Por ejemplo, los que tuvieron menor registro en Internet (con menos de seis por ciento en el ámbito doméstico) se caracterizan por una presencia de computadoras personales menor o igual a 8.5 por ciento de los hogares», refirió.
Datos sociodemográficos
Entre los trabajos generados en el Centro de Ciencias de la Atmósfera, Coria Olguín realiza minería de datos climáticos y sociodemográficos mediante metodologías de estadística y aprendizaje automático para descubrir relaciones útiles para incrementar el entendimiento de estos fenómenos y contribuir en la creación de políticas públicas.
«La UNAM provee un ambiente único para desarrollar este campo, pues tiene especialistas en estadística, aprendizaje automático e ingeniería en computación, disciplinas con fuerte arraigo en la ciencia de datos; es un escenario ideal para ahondar en esta área de investigación», concluyó.
fuente: