Descrição:
Venha fazer a diferença com performance e criatividade ao lado da Gateware!
Somos uma empresa focada em tecnologia, inovação, parceira SAP Partner Open Ecosystem e SAMSUNG SDS, participante do Pacto Global da ONU no Brasil, certificada GPTW (Great Place To Work) pela 5ª vez consecutiva e certificada GPMH (Great People Mental Health).
Com mais de 25 anos de história, promovemos a transformação através de soluções e serviços de TI.
Atuamos com:
🚀 Gestão Estratégica: GMO Gestão de Mudanças, PMO Gestão de Projetos, Cutover Estratégico e Governança Corporativa;
🚀 Alocação e Células de Desenvolvimento: Profissionais especializados e times de tecnologia, com acompanhamento diferenciado.
Além disso, inovamos diariamente para proporcionar um ambiente de alta performance e que apoia a diversidade.
Estamos com tudo pronto para dar as boas-vindas a um profissional incrível como você!
Responsabilidades
Monitorar a saúde da plataforma, desempenho de modelos e pipelines de inferência em produção
Executar procedimentos operacionais e garantir a estabilidade de aplicações baseadas em IA
Investigar e resolver incidentes por meio da análise de logs, métricas e traces
Apoiar a melhoria contínua de monitoramento, alertas e dashboards
Suportar operações de aplicações baseadas em GenAI e LLMs
Colaborar com times de Engenharia e Data Science para melhorar a confiabilidade das soluções
Requisitos
Experiência com MLOps, Machine Learning ou operações de plataformas de IA
Experiência em troubleshooting utilizando logs e ferramentas de observabilidade
Familiaridade com cloud (AWS, Azure ou GCP)
Conhecimento em pipelines de ML, APIs e sistemas distribuídos
Experiência com ferramentas de monitoramento como Datadog, Prometheus, Grafana ou Azure Monitor
