100% de match – Reclutamiento de personal usando Machine Learning

Candidato, según IA tu y yo somos la pareja perfecta!!!

Cuando inicie este escrito quería platicar sobre como los modelos de Machine Learning  están impactando en la evolución de los procesos de reclutamiento, sin embargo llegó a mi mente 2 situaciones:

  1. Recuerdo de un compañero que antes de contractar a partir de la fecha de nacimiento revisaba el horóscopo del candidato y revisaba la compatibilidad con su signo zodiacal.
  2. Publicación de LinkedIn donde se comentaba que para mitigar un mal proceso de reclutamiento los candidatos al inicio firmaban contratos mensuales (una mala practica que a la fecha se usa en algunas empresas).

No pienso profundizar sobre ambos temas, prefiero enfocarme en que una relación de trabajo exitosa consiste principalmente en la compatibilidad entre el jefe y el nuevo empleado, el mayor sesgo en la selección es la empatía que se produce en las entrevistas que tiene el candidato con el reclutador y el jefe directo.

Si la selección del mejor candidato depende de la empatía entre dos personas, entonces se podría utilizar un algoritmo similar a los sitios de búsqueda de la pareja perfecta para mejorar la selección, suena loco pero podría ser parte de una solución para reducir la rotación de la empresa, gran parte de que un empleado se mantenga en la empresa depende de la relación empleado jefe (fidelización del empleado).

Usualmente un algoritmo de match entre 2 personas tiene una salida de compatibilidad del 0 al 100%, lo cual podríamos considerarlo como un score, esta salida del algoritmo en proceso de reclutamiento no debería considerarse como el remplazo a los actuales procesos, al contrario la salida de este algoritmo sería una variable más en un modelo nuevo que considere otras evoluciones como factores para impulsar el proceso de selección del mejor candidato:

  • Test de Actitudes. Enfoque en las habilidades relacionadas al puesto.
  • Test proyectivos. Predecir comportamiento a partir de la personalidad.
  • Test de nivel intelectual.
  • Test de personalidad. Técnicas introspectiva para descartar rasgos de personalidad no compatibles con el trabajo.
  • Otros Test. Evaluaciones relacionados a temas de ética, y/o el resultado de las entrevistas.

Siendo  que mi conocimiento en dichas evaluaciones, solo serán nombradas como ejemplos más comunes,  y hablemos de forma rápida un como sería el modelo:

  • Variable objetivo:  Empleado adecuado y compatible con la posición, empresa y jefe.
  • Entrada del modelos: Los exámenes y resultados de entrevistas serían las variables a utilizar en el modelo.
  • Salida del modelo: Un score donde el valor más alto indica una mayor probabilidad de cumplir con la variable objetivo y un score bajo que el candidato esta lejos de ser el mejor.

El beneficio de este modelo sería incrementar el volumen de candidatos a evaluar reduciendo el costo unitario del procesos de selección de un candidato. Los reclutadores no solo apuntarían hacia el perfil del candidato, sino tendría mayor conocimiento de la empresa y del futuro jefe.  Esto daría el impulso necesario para mejorar  y continuar con la tendencia mostrada en el siguiente articulo que sin duda es muy interesante: Tendencias de reclutamiento en el 2018:

data trend

Otro articulo que puede darte una mejor visión de como ML será parte del proceso de reclutamiento es el siguiente: Adiós al Reclutamiento tradicional: IA ha llegado para quedarse.

IA

Otras ligas de interés:

Como todo tiene su lado malo, o mejor dicho su área de oportunidad… esto se lo dejo a los expertos de reclutamiento para que nos den su retro de lo que han leído en este articulo…. solo con sus comentario podemos afinar más el futuro del reclutamiento usando Machine Learning (ML).

Acabar con la mina de oro de los corruptos!!!

¿Machine learning podrá ser la solución para detectar actos ilícitos a funcionarios públicos?

De un noticiero mañanero escuetamente logre escuchar que entre las propuestas del presidente electo Andrés Manuel López Obrador (AMLO) se tiene pensado agregar revisiones aleatorias, sin duda lo que me llamo la atención fue el concepto de aleatorio, realmente en que podía ser aplicado y qué impacto o beneficio puede lograrse con ello.

Otra palabra que escuche fue Aduana, sin embargo no entendí más que eso, buscando en la red lo único que encontré fue una publicación del periódico proceso con el siguiente párrafo:

“… Esta ley podría incluir, entre muchas otras disposiciones, revisiones aleatorias sobre ingresos, propiedades y depósitos en México y en el extranjero de los juzgadores y demás servidores públicos …”  Ministros el candado del privilegio

Ya que de lo poco que escuche se mencionó la palabra aduana, tenemos que en las aduanas, el SAT manejaba hasta hace poco algo que se llama un semáforo aleatorio, es parte del sistema de control establecido por el gobierno federal  para realizar la verificación de importaciones y exportaciones realizadas en el país, y que tiene como objetivo el verificar que las mercancías cumplan con el pago de impuestos , requisitos y regulaciones establecidas. Aunque el nombre dice que es aleatorio realmente no lo era ya que utilizaba varios factores (tipo de Mercancía, nomenclatura arancelaria, importador o exportador, agencia aduanera, etc.), que determinaban si era necesaria la revisión de dicha mercancía.

Ahora que estamos metidos en modelos predictivos usando técnicas de Machine Learning, empecemos a desmenuzar si una revisión aleatoria es lo mejor para detectar mercancías ilícitas:

Cosas a favor de una revisión aleatoria:

  • Necesidad. El proceso aleatorio se hizo porque los recursos existentes no son suficientes para una revisión total de las mercancías que pasan por una aduana.
  • Mensaje. El mensaje es claro todos tienen las misma probabilidad de caer en revisión y esto parece ser justo para los usuarios.
  • Implementación. Utilizar un algoritmo aleatorio es sencillo, ya que en todos los lenguajes de programación tienen integrados funciones de aleatorios, incluso Excel cuenta con uno.

Cosas en contra de una revisión aleatoria:

  • No aleatoriedad. Ningún algoritmo de computadora es 100% aleatorio, ya que se pueden reproducir las condiciones y función que la genera.
  • Baja eficacia. El volumen de ilícitos identificados dependerá de incrementar recursos y no en la productividad de los mismos.
  • Baja eficiencia. Tendremos recursos desperdiciando tiempo al revisar mercancías que no requieren revisión.
  • Baja Efectividad.   La taza de ilícitos identificados sobre el total de ilícitos será igual a la proporción de mercancías revisadas del total que pasan por la aduana.
  • Molestia. Retrasar la llegada de la mercancía solo por ser aleatorio puede generar perdidas de tiempo, dinero, etc. al importador o exportador que cumple con los lineamientos de ley.

Buscando más información referente a las aduanas me tope con algunas agencias aduanales que ofrecían no pasar por una revisión, ya que sin duda conocen los factores y procesos, además posibles conexiones para evitar la revisión.

No todo lo que encontré fue malo, al contrario me tope con buenas noticias y el uso de modelos (machine learning) ya es una realidad en nuestras aduanas, el SAT cuenta con modelos de riesgo que en combinación con información generada por el Proyecto de Integración Tecnológica Aduanera (PITA)  son más asertivos y menos agresivos en las revisiones. Una prueba de esto es:

“Durante las primeros seis meses del año, gracias al modelo, se han decomisado más de 66 mil piezas de armamento, lo cual es 129 porciento más que el año pasado que no existía el sistema, mientras que se detectaron 15 millones de dólares en efectivo, que es 11 veces más de lo que se detectó el año pasado.”  Con modelos de riesgo agilizan revisión aduanera

Con el texto anterior publicado en el periódico el diario.mx, se ve claramente los beneficios que conlleva el utilizar modelos en aduanas.

Regresando a la propuesta del nuevo presidente de México, esperamos que el próximo gabinete de gobierno tomé el concepto de revisiones aleatorias pero realmente se lleve acabo la implementación y continuidad de modelos que ayuden a identificación actos delictivos. Por ello, me gustaría que llegue principalmente esta necesidad social a Rosalinda López Hernández e Irma Eréndira Sandoval (futuras  responsables del SAT  y Secretaria de la Función Publica respectivamente).

Me gustaría comentar que este modelo son complejos , que una técnica como la regresión logística no es recomendable, porque debe responder rápidamente a las tendencias y nuevas formas de cometer un ilícito, además de que aunque se maneje como una caja negra un buen data scientist podría identificar los factores y replicar el modelo y así saltar la revisión, algo que podrían vender agencias aduanales de dudoso comportamiento.

Finalmente, estos modelos deben ocupar técnicas de autoaprendizaje como redes neuronales o mucho más complejas (machine learning), donde la definición de su Variable objetivo cambia constantemente, así como los factores para identificar el acto ilícito. En la industria financiera, los modelos de fraude tienen este comportamiento principalmente a causa del rápido avance tecnológico y de las nuevas modalidades de fraudes, estos modelos dinamicos lo explicaremos a mayor detalle próximamente.