Qué difícil es decidir … Data Science o Big Data

Dos temas de moda que han abierto un mundo de oportunidades a las empresas y ofertas de trabajo principalmente para aquellos que nos enfocamos en el análisis, explotación y modelación a partir de datos, pero como profesionista: ¿puedo aplicar o ser los dos conceptos al mismo tiempo? y como empresa:  ¿Hacia dónde debo moverme? o ¿a quién debo contratar a un Científico de Datos o a un experto en Big Data?.

En algunos artículos se habla de un fuerte crecimiento de la demanda de posiciones relacionadas a estos dos temas (75% en los últimos 3 años), para México esto ya es palpable a pesar de que tiene pocos años de haberse puesto de moda. Los datos es el factor común, sin embargo el uso de datos tiene una larga historia, el cambio esta en la historia reciente donde el volumen de datos esta creciendo aceleradamente debido a los avances tecnológicos.

¿Cuál es la diferencia entre Data Science y Big Data? … empecemos describiendo de forma sencilla cada uno:

Data Science

Es un conjunto de practicas basadas en métodos científicos, procesos, algoritmo y sistemas para extraer conocimiento de una data (SQL or No SQL). La mayoría lo divide en 3 partes, pero lo importante es la relación entre ellas  tal como se muestra en la imagen:

Data scienceBig Data

Refiere a una cantidad muy elevada de datos en una variedad de formatos que no puede ser procesada efectivamente con las aplicaciones tradicionales.

La importancia de este concepto radica que permite obtener respuestas a miles de preguntas esenciales a una velocidad que sería imposible por medio del trabajo humano o almacenarlo y procesarla con una sola maquina.

Igualmente podemos describirla con aspectos que son “las 3 Vs del Big Data”:

Big Data

Aplicación de ambos conceptos

Para poder hablar de este tema, me puse de tarea leer que concepto sería mejor para algún tipo de industria, sin embargo me encontré ideas contradictorias como decir “big data es para la industria financiera y data science no lo era”, cuando los bancos en estos momentos están buscando explotar toda la información en la big data para agregar más información a sus modelos, pero al mismo tiempo están generando áreas llamadas Data science o contratando data scientist para generar dichos modelos.

Si analizamos lo anterior, esto aplicaría a todas las industrias, es decir Data Science y Big Data son conceptos que no se excluyen y su aplicación en una empresa dependerá del apetito o necesidad de la misma empresa.

10 preguntas para saber a quién contratar

Puedes hacer un ejercicio muy sencillo, ordena las preguntas por prioridad para tu empresa y ve que figura esta más enfocado a tus prioridades:

  1. ¿Quiero saber tendencias globales para obtener mas clientes?  Experto en Big Data
  2. ¿Quiero que mi sistemas se enfoquen en clientes/productos más rentables? Data Scientist
  3. ¿Qué problema clave debo resolver, es normal o pasa algo (fraudes, averías, etc)? Data Scientist
  4. ¿Dónde  puedo obtener o recolectar datos? Experto en Big data
  5. ¿Cómo procesarlo datos para analizarlos y generar información? Ambos
  6. ¿Qué investigar e identificar mi empresa ante la competencia? Experto en Big Data
  7. ¿Cómo puedo tomar decisiones rápidas y agiles?  Experto en Big Data
  8. ¿Puedo clasificar/segmentar mis productos/clientes para poder sacar mayor provecho? Data Scientist
  9. ¿Hay forma de prevenir actividades o aspectos no deseables? Data Scientist
  10. ¿Cómo puedo pronosticar mis ventas, ingresos, etc? Data Scientist

Posiblemente tu decisión se vaya a experto en big data, lo cual es muy bueno porque estas buscando nuevos horizontes para tu empresa, y seguramente lo obtendrás. Si fue para un data science seguramente hay varias áreas de oportunidad que quieres explotar. Lo genial sería contar con ambas figuras en tu empresa, seguramente tendrías más información que te ayudarían en la toma decisiones sobre el rumbo de tu empresa con impacto en corto y largo tiempo.

Ahora si me preguntas que perfil es más completo, mi respuesta se mueve hacia el científico de datos, sin embargo es muy complicado que una persona llegue a cubrir los 3 aspectos mencionados en la definición, usualmente hay diferentes tipos de científicos de datos:

  • Tipo matemático. Es muy bueno en matemáticas, estadística y modelos, su nivel de programación es alto en lenguajes estadísticos y  medio en lenguajes de uso general; ellos basan el entendimiento del negocio en indicadores y valores numéricos, por ello usualmente no seles considera muy sensible a ciertos aspectos del negocio que dependen de factores humanos. (usualmente son matemáticos,  actuarios o economistas).
  • Tipo tecnológico. Conoce sobre bases de datos y los diferentes tipos de ellas,  sabe y puede aprender varios lenguajes de programación rápidamente (SAS, R, Python, Java, Spark, etc), lo cual lo vuelve muy fuerte para big data, sin embargo ve el negocio desde una forma sistemática o de bases de datos,  y requiere repasar su nivel de estadística y técnicas como machine learning para generar buenos análisis y modelos. (Ciencias de la computación, ingeniero en sistemas, etc).
  • Experto del negocio. Este perfil es de una persona que tiene tiempo en la empresa lo cual le ha dado el conocimiento para identificar y entender las causas operativas del comportamiento de indicadores, son los mejores para interpretas números, pero su perfil es bajo en programación y aspectos matemáticos (diversas profesiones).

Basado en lo anterior puede haber un científico de datos que trabaje con la big data, la respuesta es si, principalmente si tiene una formación que proviene de IT o un fuerte conocimiento de minería de datos. Por otro lado, un experto en big data puede hacer lo de un científico de datos, también es posible pero requiere que tenga conocimientos de estadística y machine learning.

Finalmente, al ser un perfil más completo el de data science, su valor salarial promedio es cercano al doble de lo que gana un experto en big data, pero este perfil representa un reto muy grande que no es cubierto fácilmente porque no hay un equilibrio en los 3 componentes que conforman Data Science, de esto se tiene que en muchos casos hay personas que se cuelgan el titulo, pero aun le faltan desarrollar muchas habilidades.

Por cuestiones de aburrimiento se colocaron breves descripciones de los temas, pero en futuras publicaciones se estará dando por separado mayor detalle de cada uno de los temas.

Espero les haya gustado y espero sus comentarios!!!

One thought on “Qué difícil es decidir … Data Science o Big Data”

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

Conectando a %s