Oportunidades de carrera para Data Scientists

Quiz: ¿Qué tipo de profesional digital eres?

¡Responde las preguntas y averígualo!

Construye tu portfolio interactivo de Desarrollo Web

¡Destacado!

Es innegable el poder que tiene un currículo a la hora de presentarnos como profesionales. Bien..

Construye tu portfolio de Data Science

¡Destacado!

Tras el acelerado desarrollo vivido en los últimos años en la capacidad de almacenamiento y..

Construye tu portfolio de Diseño UX/UI

¡Destacado!

En el campo del diseño en general escucharas el término portfolio. Es muy habitual que un/a..

Oportunidades de carrera para Web Developers

¡Destacado!

 

¡Hola mundo, se programar! ¿y ahora qué?

 

Oportunidades de carrera para Data Scientists

¡Destacado!

Probablemente hayas escuchado hablar de la Ciencia de Datos como una de las “carreras del..

Oportunidades de carrera para UX/UI Designers

¡Destacado!

El mundo de UX está lleno de oportunidades y caminos para elegir. Si recién comienzas,..

Personal Branding: The key to achieve professional success

¡Destacado!

What´s the secret formula behind success of most recognized companies around the world?

Now..

Design your Job Search

¡Destacado!

Did you ever wonder what your job search strategy is? Are you one of the people who apply to all..

El trabajo remoto es el nuevo normal

¡Destacado!

Construyendo una carrera en Topcoder

 

¿Qué se obtiene de combinar internet, talento y mercado..

Nuestras Categorías

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam

sáb 17, 2020 07:06:42 AM

Probablemente hayas escuchado hablar de la Ciencia de Datos como una de las “carreras del futuro”. Es recurrente que aparezca al tope en los rankings de las carreras con mayor crecimiento y salario del mercado. Pero, ¿cuáles son las áreas de desarrollo para un/a científico/a de datos? ¿Qué especializaciones existen? ¿Cómo se puede integrar la Ciencia de Datos a distintas áreas? Es posible que te imagines que un/a científico/a de datos tiene que ser, necesariamente, un profesional de la programación. Sin embargo, la Ciencia de Datos está cada vez más presente en industrias tan diversas como la salud, el entretenimiento, los negocios o el periodismo. Si tienes interés en la Ciencia de Datos espero que este artículo te aporte información valiosa para proyectar tu carrera profesional. 

Los roles en esta disciplina pueden ser tan diversos como las fases de un proceso de Ciencia de Datos. Como vamos a ver a continuación, no se trata de etapas lineales, sino de un desarrollo circular e iterativo. Por tratarse de una disciplina dinámica y en constante cambio, al esquema que te voy a mostrar se le pueden agregar otras etapas. En ese sentido, lo que vas a ver tiene el sesgo de mi trayectoria y experiencia, pero te invito a que, si encuentras etapas o roles que no sumé, los menciones en los comentarios.

1

Como se observa, este esquema tiene en un eje las diferentes etapas de un típico proceso de Ciencia de Datos y en el otro, los roles que normalmente conforman el equipo. Su objetivo es servir como guía; es común que un profesional pueda tomar uno, varios o todos estos roles en un proyecto. Como profesional de la Ciencia de Datos te puedes especializar en una tecnología o puedes adquirir múltiples herramientas y conformar un perfil más general. Ambos caminos son válidos y la elección va a estar determinada por tus intereses y ambiciones profesionales.

Veamos en qué consisten estas etapas y cuáles son los conocimientos requeridos para cada una ellas

 

1. Obtención

El punto más crítico en un proceso de ciencia de datos suele ser encontrar el dataset correcto. Esta fase varía mucho en cada proyecto y sector. Puede requerir conocimiento en programación y bases de datos, o creatividad y contactos, depende del problema que estés abordando. 

Especialización:

Si quieres especializarte en la obtención de datos, sin dudas vas a necesitar mucho conocimiento en bases de datos. Para eso te recomiendo que profundices en SQL y MongoDB. Si te interesa big data, puedes explorar Apache Hadoop o Spark. Pero no te olvides de la cantidad de datos disponibles en internet, para eso hay plataformas como Kaggle o GitHub en las que vas a encontrar mucho material disponible. Por último, si la información está en internet pero no accesible, puedes utilizar técnicas de web scraping para hacerte de ella. Para eso tienes disponibles librerías como BeautifulSoup y Selenium Web Driver. Si te interesa trabajar en esta etapa, puedes buscar puestos de data engineer o arquitecto de datos.

 

2. Limpieza

Rara vez la información viene ordenada, unificada y lista para su utilización. Este paso suele ser engorroso, pero es muy necesario. En esta instancia, las tres tareas más comunes que deberías hacer son:

  • Unificar formatos: puede que tengas la información en distintos archivos o formatos. El primer paso suele ser unificar la base.

  • Valores faltantes: la información recolectada suele tener valores faltantes. Muchos algoritmos de machine learning no predicen bien si el dataset cuenta con estos, por lo que hay que reemplazarlos o eliminarlos.

  • Eliminar información irrelevante: si tu dataset contiene información irrelevante para el problema que estás trabajando, esto puede generar un gasto innecesario en la memoria. La exploración de datos puede decirte mucho sobre esto.

Especialización:

Esta instancia itera y dialoga mucho con la siguiente, de exploración. Si no tienes mucha experiencia en data science, puede que entres a un equipo realizando este tipo de tareas. Es una buena práctica y te da buen manejo de datos. Si este es tu caso y trabajas en Python, ten fresco el manejo de las librerías Pandas y Numpy.

 

3. Exploración

El objetivo de esta fase es conocer los datos, encontrar correlaciones y conseguir algún proxy que complemente tu entendimiento del problema. Es decir, convertir la información en conocimiento. Para esto será necesario que tengas conocimiento sobre la temática o trabajes con alguien que lo tenga. En una primera aproximación a la información puedes consultar las métricas importantes. Luego, puede ser conveniente realizar distintos tipos de gráficos. 

Especialización:

Si te acercas a la Ciencia de Datos desde otra disciplina es probable que te destaques en esta instancia, esto se debe a que combinas un bagaje técnico que se potenciará con habilidades de programación básicas. En este caso te recomiendo estar familiarizado/da con las librerías Seaborn y Matplotlib, utilizadas para la visualización de datos en Python. Además, contar con conocimientos en estadística y curiosidad por entender los problemas también te van a resultar de mucha ayuda. La clave estará en que logres hacer las preguntas correctas a los datos.

 

4. Modelado

Esta etapa suele ser muy atractiva y ha ganado mucho protagonismo en los últimos años. ¿Por qué? Porque con el despegue de Machine Learning y la Inteligencia Artificial, el modelado de algoritmos predictivos es una de las causas (¿o consecuencias?) del crecimiento de la Ciencia de datos. Sobre esta etapa, Esteban Roitberg -Director de la carrera de Data Science de Acamica- me explicó: ”En el desarrollo de modelos de machine learning se suele pasar el 70% del tiempo explorando y limpiando la base, y el 30% restante entrenando el modelo”.

Especialización:

El modelado requiere destreza y conocimiento en programación. En los equipos grandes de Ciencia de datos, las personas que se especializan en el desarrollo de los algoritmos de machine learning suelen destacarse en pensamiento computacional y pensamiento lógico. En ocasiones son Ingenieros o Licenciados en Ciencias de la Computación. Si estás trabajando sobre Python, la librería más utilizada es skit-learn. En R, tendrás que utilizar CARET. Si te gusta la programación, la matemática y la estadística: esta puede ser la especialidad que estás buscando. En ese caso puedes buscar puestos con el nombre de machine learning engineer.

Facundo Esparrica, quien trabaja en una fintech global me explicó que, en su industria, el desarrollo de modelos de machine learning suele estar a cargo de Actuarios -con profundo conocimiento teórico de los modelos- e Ingenieros -quienes los desarrollan eficientemente-.

 

5. Puesta en producción

La puesta en producción va a variar mucho según el proyecto en el que trabajes. Pero si hablamos de puesta en producción de modelos de machine learning, no podemos omitir el acelerado desarrollo que vimos de la nube en los últimos años. Por poner un ejemplo, cada día somos más los que utilizamos IDEs virtuales, como Google Colab. Y esto se refleja en la demanda de especialistas en ello. 

Especialización:

Python y PHP, son lenguajes que muy probablemente necesites dominar. Si te interesa saber más sobre esta etapa, este artículo hace hincapié y profundiza en las distintas especializaciones de la programación en la nube. 

 

Ciencia de Datos, una disciplina dinámica cada vez más presente en todas las industrias

Si la primera revolución industrial se trató del hierro y el carbón, la cuarta revolución -que muchos aseguran está sucediendo ahora- trata del internet de las cosas y la nube, con los datos en el centro de la escena. Es que hoy los datos son el activo más importante de empresas, organizaciones y estados. Si analizamos las empresas más valiosas de hace 30 años, nos encontramos con organizaciones con muchos activos físicos: pozos petroleros, industrias automotrices e instalación de cables y teléfonos. Mientras que si indagamos en las que más crecieron los últimos años, veremos empresas digitales que tienen en su principal activo la gestión de los datos. 

Este fenómeno no es propio del mundo de la tecnología: la presencia de esta disciplina está creciendo a pasos agigantados en prácticamente cualquier industria o sector que mires de cerca. Si observamos las industrias tradicionales, vemos empresas petroleras formando alianzas con Google y Amazon para la gestión de sus datos. O a Toyota, trabajando junto a Uber en el mismo rumbo. Ni hablar de la salud, donde los algoritmos que diagnostican enfermedades ya son una realidad. Esta tendencia trasciende las fronteras del sector privado: no hay discusión más actual que el conflicto entre Estados Unidos y China por el 5g y su consecuente exposición en la privacidad de datos, un problema de seguridad nacional. 

 

Puedes ser quien tenga la suficiente creatividad para dedicarse a la obtención de datos, o bien tener la paciencia para ordenarlos y unificarlos. También podrías ser la persona que aporte un bagaje técnico previo para encontrar las correlaciones necesarias. O quizás eres ese miembro del equipo con la habilidad de programación suficiente para enfocarte en el desarrollo de un algoritmo. También, podrías interesarte por poner todo tu conocimiento e interés en la puesta en producción. Lo que es seguro es que si estás dando tus primeros pasos en la Ciencia de datos, alguno de los distintos roles desde los que se puede aportar a la disciplina, podrá combinarse con tu perfil.

 

fotos-07

Alfonso Aguilera

Graduado, ayudante de Data Science y Fundador de Impacto Digital


Quiz: ¿Qué tipo de profesional digital eres?

Responde las preguntas y averígualo.

Asset 5

¡Quiero comenzar ahora!

Desarrollo web Full Stack

Adquiere las habilidades necesarias para construir aplicaciones web robustas.

Ver Carrera

Diseño UX/UI

Crea grandes experiencias y productos digitales que los usuarios amen.

Ver Carrera

Data Science

Aprende a manipular la infinita cantidad de datos a nuestro alcance.

Ver Carrera

¡No te pierdas de nada!

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. 

¡No te pierdas nada! Suscríbete para mantenerte al tanto de las novedades y tendencias del mundo de la educación y la tecnología.