La imagen también cuenta para un Data Scientist

Recientemente se habla de la sustitución de la mano de obra humana por maquinas, en blogs anteriores se comentó sobre el futuro de las áreas de análisis, donde  la generación de modelos que utilizan técnicas de Machine Learning se sistematizará y de igual forma se automatizarán procesos como data mining, Information Management, reporting, etc. Dado lo anterior podría ponerse en duda la continuidad del rol de Data scientist, esto no debe ser preocupante, ya que sigue existiendo una área de oportunidad mientras la decisiones sigan del lado de los humanos, esta oportunidad sonará fuera de contexto, pero es la forma en que los científicos de datos presenten los análisis y soluciones a problemas.

Para muchos científicos de datos contar con un KPI (Key Performance Indicators) puesto en un reporte es suficiente para explicar el desempeño de un modelo o del comportamiento de algún aspecto del negocio. Me he topado con varias organizaciones donde esos KPIs solo los revisan los que los hacen, triste realidad pero cierto.

Otros consideran que un dashboard con gráficas dinámicas son la opción para presentar ante un consejo directivo. Un plus si dicho dashboard contine warnings que disparen alarmas al área operativa o comercial de la organización. Esto casi siempre son creados a solicitud de un director y más porque quiere presumirlos o por reacción a un problema que no fue detectado en tiempo.

Si observamos en el interior de una empresa, esta seguramente esta llena de KPIs, dashboards de cada departamento, los cuales tienen su tiempo de moda y se quedan produciendo por mucho tiempo sin que nadie los utilice. Como se dice tan malo es no tener información como tenerla en exceso.

Otro problema que viene de contar con KPIs es que cuando le preguntas a un gerente que sucede en su departamento/área la respuesta es me esta yendo mal en cierto indicador, pero no menciona la causa operativa y cuando le preguntas por su plan de mejora su respuesta es mejorar el indicador… con respuestas como estas se puede observar un claro desconocimiento de la relación entre el indicador y la parte operativa, ya que seguramente las instrucciones que serán derivadas a los subordinados será que mejoren dicho indicador y no un plan con acciones especificas a corto, mediano y largo plazo. Las instituciones están creando gerentes con mayor información del desempeño pero menor control de la situación.

Un científico de datos no es una persona que se dedica a hacer reportes y muchas veces se piensa que ese es su objetivo. Como lo mencione anteriormente, muchos aspectos serán automatizados, pero ¿Qué pasaría con los científicos de datos? … pues, continuar con el objetivo principal de resolver problemas con datos complejos mediante el empleo de una profunda experiencia en alguna disciplina científica, pero sobre todo hacer que el resultado obtenidos pasen de una solución teórica a acciones con impacto positivo en el desempeño/utilidades de la empresa.

Suena bonito, pero si tu eres un científico de datos o estas en camino a serlo, cuestiónate si  has sido actor activo de las tomas de decisiones, y no es valido mencionar que si, porque los indicadores de desempeño de tu modelo muestran un poder predictivo o poder de clasificación en buenos niveles y estable. Aclaro no subestimo la creación de un buen modelo, lo que quiero dar a entender es que esa parte en un futuro no estará en nuestra mano… lo que estará en nuestra mano es resolver problemas y cómo presentarlos, por ello pensemos en lo siguiente puntos que involucran la solución de un problema:

  • Síntoma. Usualmente lo observamos por indicadores, pueden tenerse alarmas, early warnings, tendencias, etc. que son observados en KPIs y/o Dashboards.
  • Identificación. Se trata de entender el impacto que tiene el problema, qué otros indicadores podrán ser afectados, es un problema general o esta focalizado, ya ha pasado un problema similar, etc.
  • Causa. Se dejan los indicadores y se habla de situaciones reales, causas internas o externas que están afectando los procedimientos o aspectos operativos.
  • Plan de acción. Se genera una solución Smart con objetivos claros y de sencillo entendimiento para equipo operativo, utilizando su lenguaje.
  • Seguimiento. Los objetivos trazados en el plan se convierten en indicadores al que se les estará dando seguimiento por medio de indicadores de desempeño a corto, mediano y largo plazo. También se debe hacer un análisis del impacto del plan generado.
  • Registro de buenas practicas. El plan con los resultados de análisis de impacto deben ser guardados para ser utilizados en un futuro, ya sea para implementarlo o evitar usar aquellos sin impacto positivo.

La solución debe tener un soporte técnico por parte del científico de datos que le sentido a cada punto,  seguramente se estará usando minería de datos, aplicar la estadística en análisis e interpretación de indicadores, investigaciones en campo como levantamiento de un muestreo, para identificar impactos se pueden generar modelos de elasticidad, pronósticos, etc.

Con todo lo anterior,  se debe generar un documento que contenga todo el sustento del análisis y una presentación ejecutiva para la toma de decisiones, en esta presentación se debe tener un guion claro de lo que se quiere contar y así como el efecto que debe causar en las personas que tomaran decisiones. Para ello, se necesita conocer que es lo que esperan ver en el documento, no siempre una tabla con números será la opción más adecuada y tendrás que colocar alguna imagen que mande tu mensaje de forma rápida y sencilla, la interpretación de los indicadores sin demasiado texto y de forma puntual harán que se reduzcan las preguntas, los números toman mayor credibilidad si son sustentados con aspectos operativos extraídos de la gente experimentada que esta involucrada en el tema, como cosas como lo anterior podemos mejorar la imagen de nuestra presentación (Aun hay más recomendaciones para realizar una presentación el cual serán explicadas en futuro blog) .

La forma en que se analiza un problema, como se interpreta y comunica la solución para otros humanos es la imagen que también cuenta para un data scientist y que le seguirá dando valor a pesar de la sistematización y automatización de muchos proceso. Digamos que el generar una buena imagen será el reto más difícil de copiar que tendrán las maquinas.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

Conectando a %s