DaCodes

GCP AI Platform MLOps Engineer (DevOps + Machine Learning Operations)

Posted: just now

Job Description

¡Trabaja en DaCodes!Somos una firma de expertos en software y transformación digital de alto impacto.Durante 10 años hemos creado soluciones enfocadas en la tecnología e innovación gracias a nuestro equipo de +220 talentosos #DaCoders, incluyendo desarrolladores, arquitectos, diseñadores UX/UI, PMs, QA testers y más. Nuestro equipo colabora en proyectos con clientes en LATAM y Estados Unidos, logrando resultados sobresalientes.En DaCodes, tendrás la oportunidad de impulsar tu desarrollo profesional, trabajar en diversos proyectos dentro de distintas industrias, y contribuir al diseño, implementación y optimización de infraestructuras en la nube.Nuestros DaCoders tienen un gran impacto en el éxito de nuestro negocio y el de nuestros clientes.¿Te interesa?RequirementsEste puesto corresponde a un Machine Learning Operations Engineer, pero con un enfoque distinto al MLOps tradicional. En lugar de centrarse en entrenamiento de modelos o experimentación, este rol está orientado a la operación, despliegue y mantenimiento de plataformas de IA en producción dentro de GCP.El perfil ideal combina:✔ Competencias de DevOps / Cloud Engineering CI/CD con GitLab IaC (Terraform) Orquestación con Kubernetes/GKE Gestión de IAM, VPCs, redes y seguridad Automatización y operación de servicios cloud de alta concurrencia ✔ Competencias de MLOps orientadas a IA aplicada Frameworks multiagente (LlamaIndex Workflows, LangGraph, ADK) Vertex AI y MLflow para trazabilidad y operación Manejo de estados, sesiones y eventos Monitoreo y control de costos por tokenización en LLMs El rol se centra en construir, automatizar y operar la infraestructura necesaria para sistemas basados en IA y agentes, asegurando escalabilidad, eficiencia y trazabilidad dentro del ecosistema Google Cloud Platform.REQUERIMIENTOSSkills Deseables Experiencia en la construcción de pipelines CI/CD con GitLab, incluyendo integración con GCP , MLflow , Vertex AI, Artifact Registry. Experiencia en el proceso de deployment de workflows multiagente, orientados a frameworks de alta concurrencia como LlamaIndex Workflows, LangGraph, ADK, con manejo de sesiones, estados, eventos e ingeniería de contexto. Experiencia programación e implementación de Infraestructura como Código (IaC) utilizando Terraform. Experiencia en configuración y orquestación de Kubernetes o Google Kubernetes Engine (GKE), incluyendo esquemas de CPU y GPU compartidas. Dominio de servicios como Google Cloud Run, Google Compute Engine, Cloud Functions, Pub/Sub, administración de IAM Roles, Elastic Load Balancers, Identity-Aware Proxy (IAP), Secret Manager, Cloud SQL y Dataflow, Networks, VPCs , Reglas de comunicacion en general GCP. (Si está certificado mejor) Implementación de sistemas de trazabilidad y monitorización con MLflow, Grafana, Datadog y Looker Studio. Conocimientos de dimensionamiento de capacidades computacionales para cargas de alta demanda y concurrencia, así como técnicas de aceleración por GPU. Nice to Have Ciencia de datos Conocimientos en técnicas avanzadas de procesamiento de lenguaje natural (NLP)Principales Responsabilidades Implementar los ambientes requeridos por el squad de IA. Asegurar las buenas prácticas de deployment, incluyendo branching, naming y versioning. Implementar diferentes estrategias de branching, incluyendo CI/CD, GitFlow, entre otras. Ser owner de los deployments y coordinar los esfuerzos relacionados con dicho proceso. Apoyar al equipo con autenticaciones, permisos, roles, accesos, etc. Dimensionar los costos de infraestructura previo a la implementación de sistemas orientados a IA y arquitecturas basadas en agentes. Monitorizar costos de infraestructura y costos asociados a la tokenización de entrada y salida de los LLM utilizados por los workflows agenticios. Benefits🚀 Integración a marcas globales y startups disruptivas.🏡 Trabajo remoto/Home office.📍 En caso de requerir modalidad híbrida o presencial, serás informado desde la primera sesión.⏳ Horario ajustado a la célula de trabajo/proyecto asignado.📅 Trabajo de lunes a viernes.🎉 Día off en tu cumpleaños.🏥 Seguro de gastos médicos mayores (aplica para México).🛡️ Seguro de vida (aplica para México).🌎 Equipos de trabajo multiculturales.🎓 Acceso a cursos y certificaciones.📢 Meetups con invitados especiales del área de IT.📡 Eventos virtuales de integración y grupos de interés.📢 Clases de inglés.🏆 Oportunidades dentro de nuestras diferentes líneas de negocio.🏅 Orgullosamente certificados como Great Place to Work.

Job Application Tips

  • Tailor your resume to highlight relevant experience for this position
  • Write a compelling cover letter that addresses the specific requirements
  • Research the company culture and values before applying
  • Prepare examples of your work that demonstrate your skills
  • Follow up on your application after a reasonable time period

You May Also Be Interested In