Data Analyst
Probablemente el perfil más conocido y de mayor “antigüedad” sea el analista de datos. Estos profesionales se encargan, en términos muy generales, de la consulta y procesamiento de datos para dar informes de manera resumida o de forma gráfica y visual.
El objetivo final del analista de datos es la resolución de problemas, para ello se valen de este trato con la información a través de herramientas y métodos para facilitar y ayudar a las personas dentro de su organización, tanto en la comprensión de los datos iniciales, como del problema resultante y la solución propuesta.
La mayor diferencia que pudiera tener el analista de datos con nuestros siguientes perfiles es el límite en la cantidad de información que trata para su análisis.
Esto también de alguna manera limita la posibilidad de que desarrolle nuevos algoritmos de análisis para problemas muy específicos.
Data Scientist
Por otro lado, los científicos de datos pueden dar ese siguiente paso al análisis de grandes datos gracias al impulso de la automatización que le da el aprendizaje automático. Dicho esto, las organizaciones esperan del científico de datos un valor útil a los grandes volúmenes de datos, sin embargo para ello requieren de algunos conocimientos y habilidades específicas tales como:
- Capacidad de programación
- Capacidad para diseñar nuevos algoritmos
- Manejar grandes volúmenes de datos
- Aplicar estadísticas
- Conocimiento en aprendizaje automático
- Conocimiento en enfoques analíticos para la resolución de problemas empresariales
- Interpretación y entrega de resultados mediante técnicas de visualización
- Comunicación efectiva y empresarial
Data Engineer
Si hemos de partir de la localización del Data Engineer frente a los dos anteriores, sin lugar a dudas funge como puente y facilitador.
Es pertinente hacer la aclaración de que cada uno de estos perfiles tiene un valor muy específico dentro de las organizaciones, por lo que uno no resulta más necesario otro. Sin embargo, el Data Engineer tiene un valor agregado y una posibilidad en su campo de acción más amplio, al punto de poder considerarlo un Data Architect.
Un Data Engineer prepara, desarrolla y mantiene toda la estructura para el Big Data, que es común que sea analizado por el científico de datos como ya hemos enunciado. Pero ¿Qué implica la infraestructura del Big Data?
Implica que el Data Engineer tendrá que desarrollar, construir, integrar y administrar diversos recursos para la obtención de los datos.
Su objetivo es facilitar y cuidar la accesibilidad de los datos, optimizando todo el gran ambiente de datos de la empresa. Para ello es requerido que posean un amplio conocimiento en diversas herramientas, así como de habilidades como:
- Conocimiento en bases de datos relacionales (Cassandra o MongoDB) y del lenguaje de consulta SQL
- Técnicas de limpieza, sumarización y validación de los datos
- Soporte a la configuración de los clusters de procesamiento, memoria y otros parámetros
- También es interesante que conozca el uso de motores de indexación como ElasticSearch
- Conocimiento de las tecnologías que permiten el acceso a los datos en tiempo real (Streaming)
Más allá de esto, dado que los Ingenieros de datos se centran en el diseño y la arquitectura, generalmente no se espera que conozcan ningún aprendizaje automático o análisis de big data, sin embargo gracias a la implementación en la nube, como en la flexibilidad que tienen los Data Engineer en su campo de acción, ha propiciado que más empresas se interesen por este perfil, justamente por la entrega de resultados a partir del tratado de los datos desde su captación hasta su análisis.
Esto último se ve reflejado en la demanda y valorización de certificaciones en análisis de datos como lo es AWS Certified Data Analytics – Specialty.
Esta certificación es un claro ejemplo de cómo el campo de acción cada vez se amplía más por la adopción de la nube, pues si revisamos la guía de examen para la obtención de esta certificación encontraremos 4 dominios de conocimientos que comparten estos 3 perfiles antes mencionados. Colección, Almacenamiento / Gestión de datos, Procesamiento y Seguridad.
A manera de conclusión podemos decir que cualquier especialización en la que estés interesado tiene su propio valor, sus propios retos y camino, sin embargo si somos conscientes a partir de las experiencias que hemos recolectado, que la ruta más idónea es perfilarse como un Data Engineer o Data Architect, pues facilita la divergencia en proyectos en los que podrías estar colaborando. Además proporciona un gran rango de conocimientos y habilidades necesarios, sobre todo ahora con la migración de las grandes empresas a la nube.