in

Escasez de científicos de datos

Los científicos de datos quizá luzcan apetecibles hoy, pero la automatización se ganará los corazones de todos al final del día. Eso dice el cofundador y científico en jefe de Narrative Science, Kris Hammond, quien predice que este año traerá consigo menos inversión en “ciencia de datos potenciada por humanos” y más inversión en herramientas de software automatizadas que extraerán big data para liberar información de valor.

En entrevista con InformationWeek en Estados Unidos, Hammond –quien es también profesor de Ciencias de la Computación en la Universidad Northwestern– habló sobre diversos temas enfocados en datos, incluyendo lo que él ve como el final de la “era de la acumulación de datos” en la empresa y el surgimiento de la inteligencia artificial (sin los robots aniquiladores) en la vida cotidiana.

Narrative Science provee una clase de esta automatización. La compañía produce software de generación en lenguaje natural, más notablemente Quill, que examina torrentes de big data, extrae información relevante para el usuario y genera (o escribe) reportes en lenguaje humano, generalmente en inglés. Entre sus competidores se cuentan Automated Insights, cuya plataforma Wordsmith genera también reportes escritos (a veces miles por segundo), incluyendo historias deportivas y financieras online que son leídas por mucha gente.

Hammond no tiene nada en contra de los científicos de datos (él mismo es científico de datos). Pero cree que el crecimiento explosivo de las tecnologías de big data requerirá un enfoque más automatizado del análisis de la información. Además, los científicos de datos son empleados costosos y simplemente no hay suficientes de ellos en el mercado laboral, afirma.

“Nunca podrán escalar al tipo de generación de reportes que es absolutamente esencial para las organizaciones ahora”, comentó Hammond. A menudo se requieren científicos de datos para hacer tareas relativamente mundanas que no dan buen uso a sus habilidades de análisis de datos. Un ejemplo, a decir de Hammond, es “que me pidan dedicar mi día a analizar cifras de ventas de 10,000 tiendas y redactar reportes con base en esas cifras de ventas”. Y agregó: “Si alguien me pidiera hacer eso, bien podría hacerlo. En realidad esa tarea precisa algunas de mis habilidades, pero me mataría. Me volvería loco porque, de hecho, no requiere que use mis habilidades al máximo”.

Esta dicotomía entre lo mundano y lo magnífico es muy común en los equipos de Data Science de la actualidad. Y conforme se acumulan volúmenes cada vez más grandes de datos, como los que se reciben de miles de millones de dispositivos conectados a Internet, la necesidad de la automatización se hace más evidente.

“Los científicos de datos, debido a su escasez y a lo costosos que son, y porque desean trabajar en la resolución de problemas difíciles e interesantes, no nos ayudarán a entender las nimiedades de los datos, ni siquiera a comunicar los elementos básicos de lo que sucede en el mundo”, comentó Hammond.

Una mayor dependencia del análisis automatizado podría ayudar a las empresas a extraer valor de sus pilas de big data en aumento constante, que se miden ahora hasta en petabytes (PB). “No todos tenemos que volvernos científicos de datos para trabajar con la máquina. Ésta necesita volverse más humana y trabajar con nosotros”, concluyó el entrevistado.

Fuente: InformationWeekMexico.com

¿Qué te pareció la publicación?

Automatizar la escritura humana

Código de ética empresarial