某知名ai公司
Devops
信息技术
科技
上海
5-10年
本科
¥30 - 45K13薪
职位描述
岗位职责
1. 云原生基础设施建设
负责公司 AI/后端服务的 云原生架构设计与落地(Kubernetes、Docker、Helm)
构建高可用、高扩展的服务部署体系
维护多环境(Dev / Staging / Prod)的一致性与稳定性
2. CI/CD 与自动化
设计并维护 CI/CD Pipeline(GitHub Actions / GitLab CI / Jenkins)
自动化构建、测试、部署流程
推动基础设施即代码(IaC),使用 Terraform / Pulumi / Ansible
3. AI 模型服务运维(可选但加分)
负责大模型推理服务的部署、扩缩容、性能优化
管理 GPU 集群、推理框架(vLLM、TGI、TensorRT-LLM 等)
优化模型服务的监控、日志、告警体系
4. 可观测性与平台稳定性
构建监控体系(Prometheus、Grafana、ELK、OpenTelemetry)
负责日志、链路追踪、指标监控、告警策略
处理生产环境故障、性能瓶颈、容量规划
5. 安全与合规
负责服务安全加固、权限管理、密钥管理(Vault、KMS)
推动 DevSecOps,集成安全扫描、漏洞检测
保障数据安全、访问控制、合规性