in

Automatizar la escritura humana

El software que inició escribiendo reportajes deportivos ahora ha encontrado otra opción profesional: la redacción de informes de los gigantes financieros y las agencias de inteligencia de Estados Unidos.

El software de escritura, llamado Quill, fue desarrollado por Narrative Science, una compañía de Chicago fundada en 2010 para comercializar la tecnología desarrollada en la Universidad Northwestern que convierte los datos numéricos en historias escritas. No pasó mucho tiempo antes de Quill fuera utilizado para informar sobre los juegos de béisbol en la televisión y en medios de deportes en línea, así como las declaraciones de ingresos de las compañías clientes de Forbes.

El éxito en la temprana carrera de Quill generó titulares en los periódicos, y el software fue visto por algunos como evidencia de que el software inteligente podría desplazar a los trabajadores humanos. El CEO de Narrative Science Stuart Frankel dice que la publicidad, aunque algunas eran negativas, fue una bendición. “Mucha gente se sintió amenazada por lo que estábamos haciendo, y nos dieron un montón de cobertura”, dice. “Esto condujo a una gran cantidad de consultas de todas las industrias y de diferentes empresas”.

Narrative Science ahora trabajar en afinar sus habilidades de escritura para atender clientes financieros como T. Rowe Price, Credit Suisse y USAA. Una de sus principales tareas es la de redactar en profundidad, los extensos  informes sobre el desempeño de los fondos de inversión que luego son distribuidos a los inversores o reguladores.

“Reducimos el trabajo de un pequeño ejército de personas durante semanas a unos pocos segundos”, dice Frankel. “Hacemos desde 10 documentos, a 15 páginas para algunos clientes financieros”.

Una inversión de In-Q-Tel, la división de inversiones de la CIA, llevó a la empresa a trabajar a partir de múltiples agencias de inteligencia estadounidenses. Cuestionado sobre ese trabajo, Frankel dice que “Los retos de la comunicación de la comunidad de inteligencia de Estados Unidos son muy similares a las de nuestros otros clientes”. En total, Quill ahora produce en serie millones de palabras por día.

La salida del software puede ser impresionante, pero no se puede escribir sin algunos datos numéricos como inspiración. Se realiza un análisis estadístico de los datos, en busca de acontecimientos o tendencias significativas, y se basa en el conocimiento sobre los conceptos clave tales como la quiebra, el beneficio y los ingresos, y cómo se relacionan estos conceptos.

El párrafo siguiente, a partir de un informe de inversiones, muestra que Quill puede escribir un texto aceptable para un documento de este tipo, pero todavía se puede sentir como si estuviera escrito por una computadora.

“El sector energético fue el principal contribuyente a la rentabilidad relativa, liderado por la selección de valores en los equipos y empresas de servicios energéticos. En cuanto a los contribuyentes individuales, una posición en el equipo y los servicios energéticos empresa Oceaneering Internacional fue el mayor contribuyente a la rentabilidad. La selección de valores también contribuyó a los resultados relativos en el sector de la salud. Posicionamiento en los equipos de atención médica y suministros de la industria ayudó a la mayoría”.

Quill se programa con reglas de escritura que utiliza para estructurar oraciones, párrafos y páginas, dice Kristian Hammond , profesor de ciencias informáticas en la Universidad Northwestern y jefe científico de Narrative Science. “Sabemos cómo introducir una idea, cómo no ser repetitivos, cómo hacerla más corto”, dice.

Las empresas también pueden afinar el estilo y uso del lenguaje de Quill basado en lo que ellos necesitan escribir. Se puede acentuar lo positivo del aspecto comercial, o ir por el detalle exhaustivo para una presentación ante reguladores, por ejemplo.

Quill también puede tener un “ángulo” para una pieza de escritura. Al escribir acerca de los deportes para un público propenso a favorecer un equipo en particular, por ejemplo, Quill puede escribir una historia que suaviza el golpe de una derrota deportiva.

Narrative Science no publica detalles técnicos de cómo funciona Quill. Pero Michael White, un profesor asociado en la Universidad Estatal de Ohio, dice que su capacidad a la delicadeza en el “ángulo” es lo que lo diferencia de otros sistemas predecesores.

Lo que se conoce como software de “generación de lenguaje natural” ha sido un tema de investigación durante años, pero recientemente ha comenzado a mostrar promesas más comerciales, dice White. “Cada vez hay más conciencia de que grandes cantidades de datos y hechos relevantes que se vizualizán, no son realmente útiles si no se pueden explicar”, dice White. “Yo diría que el tiempo finalmente ha llegado para la generación de lenguaje natural y lograr a la vez un éxito comercial.”

Otras empresas que trabajan en la tecnología incluyen Arria, una empresa con sede en Reino Unido que se quedó fuera de la investigación de la Universidad de Aberdeen, en Escocia. Una startup llamada Pittsburgh OnlyBoth, fundada el año pasado, planea lanzar sus primeros productos de software de escritura a más tardar este 2015.

Todas esas empresas están centradas hasta ahora en servicios a empresas. Pero Hammond dice que como los coches, aparatos sanitarios y electrodomésticos que ahora están conectados a Internet, las sencillas listas y símbolos que utilizan para comunicarse con los humanos no son suficientes. “La mayoría de las familias no van a ser capaces de hacer ciencia de datos para hacer que sus termostatos y coches y otros datos sean comprensibles”, dice Hammond. “Esta tecnología va a ser la  voz descriptiva de todo lo que tiene de datos.”

Fuente: MIT Technology Review Online

¿Qué te pareció la publicación?

IFAI vs Google

Escasez de científicos de datos