Administrador HPC y MLOps
- Donostia / San Sebastián
Administrador HPC y MLOps
Buscamos una persona motivada, con experiencia demostrada en la gestión de sistemas TI y Cloud, para formar parte de un equipo dedicado al diseño y puesta en marcha de un sistema de cálculo común para toda la organización dedicada al soporte de los proyectos de investigación. De esta forma se pretende cubrir de forma más eficiente y democrática las necesidades de cómputo de los investigadores de la organización, además de ser más eficiente desde el punto de vista de gestión y mantenimiento de los recursos.
Se pretende que el candidato tenga conocimientos y experiencia para gestionar en base a buenas prácticas, la configuración, mantenimiento, actualización y monitorización del sistema de cálculo en dos niveles: (1) La Infraestructura hardware de HPC, Inteligencia Artificial y Big Data, que incluye clústeres locales de máquinas que usan la última tecnología GPU y otros entornos hardware para el entrenamiento, test e inferencia de modelos de Deep Learning, almacenamiento distribuido y CI/CD. (2) La plataforma software que proporciona aplicaciones y servicios que permitan desarrollar el trabajo de investigación de forma eficiente, además simplificar las operaciones de integración, mantenimiento y monitorización. Otros objetivos estarán ligados a la participación activa en los proyectos de investigación como soporte y apoyo a los investigadores en la implantación de las tecnologías emergentes e innovadoras.
Los candidatos deberán mostrar una actitud proactiva hacia la solución de problemas, capacidades excelentes de tecnologías de la información (TI), trabajo en equipo y compromiso con la compresión de las necesidades de los compañeros. Los candidatos deberán tener también las habilidades necesarias en tecnologías cloud, devops y sistemas, especialmente sistemas distribuidos de cómputo y almacenamiento, escalabilidad y seguridad. Se valorará el conocimiento en procesos de machine learning y el procesamiento general de datos
Se considerarán tareas y responsabilidades:
- Evaluar la infraestructura de HW existente (centrado en servidores GPU, servidores de archivos y redes), identificar las necesidades y participar en el proceso de diseño de modernización del sistema
- Deducir las necesidades HW futuras
- Ayudar en la implementación de plataforma HCP interna (colaborar con consultores externos del centro)
- Mantener, actualizar y dar soporte al HPC interno
- Implementar buenas prácticas en CI/CD y MLOps
- Desarrollo de middleware para MLOps
- Dar soporte/consultoría para la implementación de MLOps para terceros, en clouds/clústeres privados o públicos
Las personas aspirantes deben tener:
Educación: Al menos, máster en computer science o telecomunicaciones
Experiencia: Buscamos un Ingeniero/a versátil con experiencia demostrable en las siguientes áreas:
- Experiencia en entornos Linux (gestión de usuario, scripting, gestión de servicios, monitorización y ajuste de procesos)
- Experiencia en configuración de redes (monitorización de tráfico en redes de comunicación y seguridad)
- Sistemas de almacenamiento distribuidos (S3, BeeGFS, Lustre, Ceph, configuración NAS)
- Sistema de programación de trabajos HPC: Slurm
- Tecnologías de contenerización: Docker
- Microservicios y tecnologías de orquestación: Kubernetes
- Herramientas CI/CD: GitLab
Valoramos que las candidaturas cuenten con:
- Experiencia en arquitecturas HPC, servidores GPU, data-driven architectures, almacenamiento distribuido
- Soluciones de virtualización bare-metal: Proxmox, MAAS, OpenStack
- Implementación de sistemas Big Data y BBDD: Kafka, PostgreSQL, Spark, MongoDB, Cassandra
- Herramientas de automatización de la configuración: Ansible, Puppet,…
- Conocimiento de diferentes proveedores de servicios cloud y sus ofertas de servicio (p. ej. IaaS, PaaS): Amazon Web Services, Google Cloud Platform, Microsoft Azure
- Infraestructuras definidas por código: p. ej. AWS CloudFormation, Terraform
- MLOPs y herramientas de gestión del workflow de IA: Airflow, Kubeflow, etc.
Ofrecemos:
- Incorporación a un Centro dinámico, innovador y puntero en el ámbito de Inteligencia Artificial y Visual Computing & Interaction a nivel internacional con centros de trabajo en Donostia.
- Equipo de trabajo multidisciplinar en el departamento de Posicionamiento Digital.
- Libertad creativa a la hora de realizar investigaciones alineada con los procedimientos de gestión del Centro.
- Desarrollo personal a través de oportunidades de formación y educación.
- Posibilidades de carrera y progresión profesional.
- Políticas de conciliación para lograr un equilibrio entre la vida laboral y familiar.
- Igualdad de oportunidades laborales.