Opiniones | Opinions | Editoriales | Editorials

Entrevista ejecutiva: Gideon Mann, director de ciencia de datos para Bloomberg

 
Picture of System Administrator
Entrevista ejecutiva: Gideon Mann, director de ciencia de datos para Bloomberg
by System Administrator - Monday, 13 March 2017, 11:05 PM
Group Colaboradores y Partners

Entrevista ejecutiva: Gideon Mann, director de ciencia de datos para Bloomberg

por Cliff Saran

Descubrimos cómo Gideon Mann de Bloomberg equilibra la certeza de la analítica con la alquimia del aprendizaje automático.

La ciencia de los datos es una de las cuatro áreas de enfoque dentro de la oficina del CTO en la empresa de noticias y datos financieros Bloomberg, y el jefe del área de ciencia de datos es Gideon Mann.

Mann profesa que su definición de ciencia de los datos no es tradicional. "La gente define la ciencia de los datos de muchas maneras diferentes", dice. "La ciencia de datos de Bloomberg no es convencional y se centra en tres áreas tecnológicas: procesamiento del lenguaje natural, recuperación y búsqueda de información y aprendizaje automático central".

Se puede argumentar que la recuperación y búsqueda de información es la que más se ajusta a la ciencia de datos convencional. Mann dice: "Recordando la década de 1990, no tenías Google, Bing o Yahoo y no se podía encontrar todo en internet. La vida era muy diferente.”

Pero a pesar de los avances en los motores de búsqueda de internet, tienen sus límites, dice Mann. "A menudo se puede encontrar el documento deseado, pero no necesariamente se puede encontrar la información que se desea. Si esa información vive en muchos documentos, no hay nada que pueda ayudarte".

Al investigar sobre un tema, la gente pasaba mucho tiempo acudiendo a bibliotecas, leyendo índices, encontrando libros, compilando –y haciendo esto varias veces. "Ahora usted puede reunir todos los documentos muy rápidamente, pero a menos que hayan sido pre-ensamblados en un lugar, todavía hay un paso de evaluación", dice.

Mann cree que hay demasiado spam de información y, a pesar de los avances tecnológicos en los motores de búsqueda, nadie ha logrado obtener un verdadero sentido de la comprensión del significado dentro de la masa de información que sale como agua del grifo. "El impacto de toda esta disputa, al decidir lo que es verdad, si sucedió algo o si es un hecho alternativo, significa que hay un paso grande entre ensamblar documentos a extraer significado de los mismos", considera.

El procesamiento del lenguaje natural en Bloomberg implica extraer información del texto escrito. Por ejemplo, Mann dice que el procesamiento del lenguaje natural podría ser usado para determinar el sentimiento alrededor de una compañía en particular. "Hay mucha información contenida en el texto", dice. "Por ejemplo, Kraft fabrica muchos, muchos productos. ¿Qué son? Tradicionalmente, el enfoque ha sido un análisis estructurado de datos. Ahora la frontera está buscando extraer esta información de múltiples bibliotecas."

Aprendizaje de máquina principal

Podría decirse que el aprendizaje automático adopta un enfoque muy diferente para resolver problemas en comparación con la programación de la computadora para calcular los resultados correctos, basados ​​en un determinado conjunto de datos. Esto significa que la gente de TI no puede recurrir naturalmente al aprendizaje automático para resolver un problema en particular, incluso si es un buen ajuste para este enfoque.

Pero como Mann señala: "Si me hablan, ya han bebido Kool Aid."

A veces, dice Mann, las expectativas de la gente pueden ser poco realistas, o no están seguros de las limitaciones de los algoritmos de aprendizaje automático. "No creo que tengas que llevar a la gente al agua. En cambio, tienes que equiparlos con las maneras de pensar", dice.

Una de las primeras veces que Bloomberg utilizó el aprendizaje automático fue para el análisis del sentimiento en 2008-2009. "Como empresa, hemos estado haciendo análisis durante mucho tiempo", dice Mann. "Cómo hacer el aprendizaje automático es definitivamente un cambio de cultura."

Refiriéndose al proyecto de análisis del sentimiento, dijo: "Intentaron enfoques convencionales y éstos no funcionaron. Eran frágiles y requerían mucho esfuerzo manual. Pero el aprendizaje automático simplemente funcionó."

 

Gideon Mann, Bloomberg

Desde entonces, el grupo que estudió el aprendizaje automático para el proyecto de análisis del sentimiento ha crecido y está abordando nuevas áreas dentro de Bloomberg, donde el aprendizaje automático es ahora una competencia básica. "Todas las personas que ahora contratamos para este tipo de trabajo provienen de este trasfondo. Está en su mentalidad", dice Mann.

Hablando de su papel en Bloomberg, Mann dice: "Quiero tener tantas personas como sea posible haciendo aprendizaje automatizado en la empresa y esto requiere enseñar a muchas personas diferentes lo que significa. Algunos son programadores. Les mostramos el tipo de problema que podrían funcionar con una solución de aprendizaje automático, o les mostramos el ciclo de desarrollo y dónde pueden tener problemas y cómo abordarlos".

Él dice que sus aplicaciones pueden experimentar problemas de rendimiento, y que la superación de éstos implica la recopilación de más datos y el reciclaje de la inteligencia artificial (AI).

Tradicionalmente, cuando se prueba una aplicación en desarrollo y produce resultados erróneos, los codificadores deben volver al código fuente y rastrear dónde se produce el error. Pero en el aprendizaje automático, el resultado equivocado es parte del entrenamiento, dice Mann.

"Es casi como un conjunto diferente de pruebas. Tienes que probar la corrección del algoritmo y tienes que probar la precisión del algoritmo. Y a menudo es muy difícil desentrañar estas dos cosas."

El desafío para el programador es determinar si la AI está recibiendo la respuesta equivocada porque el algoritmo es defectuoso o si en los datos que ha ingerido para el aprendizaje falta alguna información clave, lo que afecta a la capacidad de la IA para hacer coincidir los patrones con precisión.

AI arriesgada

Más allá de la programación, los grandes desafíos para el aprendizaje de máquina incluyen determinar si un proyecto tendrá éxito, dice Mann. "Usted no haría el proyecto si no tuviera ninguna posibilidad de éxito y probablemente querría una alta probabilidad de éxito, pero nada está garantizado", dice. "Puede ser más complicado en formas que usted no espera."

Al iniciar un nuevo proyecto, por lo tanto, es necesario comenzar a reducir el riesgo de fracaso y evaluar lo que simplemente la máquina no puede aprender, dice Mann. Un proyecto de aprendizaje automático puede o no funcionar, y los líderes de proyectos deben ser capaces de abordar este riesgo al presentar un caso de negocio.

Dado que los altos ejecutivos de negocios pueden hacer que el aprendizaje de máquinas sea un proyecto de mascotas, es importante manejar sus expectativas, dice. "Siempre hay riesgos. Vienes bien preparado, realizas pequeños experimentos, pruebas de concepto, pequeños compromisos y pequeños despliegues, y obtienes ideas para tratar de reducir los riesgos".

La gente a menudo se aproxima a proyectos de alto riesgo mediante la construcción de un producto mínimo viable (MVP), dice Mann, y para un algoritmo de aprendizaje de máquina, el MVP para un producto de aprendizaje automatizado podría ser sólo una faceta del algoritmo. "Lo tomas en serio como un riesgo, entonces minimizas ese riesgo", concluye el ejecutivo.

Próximos pasos

Link: http://searchdatacenter.techtarget.com

1164 words