Site Reliability Engineer
- On-site
- تهران, Fārs, Iran, Islamic Republic of
- Technical Product
Job description
- مسلط به سیستم عامل لینوکس و تجربه نگهداری آن در مقیاس بزرگ
- دانش کافی در کار با سرویسها و پروتکلهای شبکه (TCP/IP , TLS , DNS , HTTPS)
- دانش کافی در مورد Git و GitFlow
- تجربه کار با یکی از زبانهای Golang یا Python و اسکریپت نویسی با Bash
- تجربه کار با ابزارهای Configuration Management مانند Ansible و SaltStack
- تجربه کار با ساختارهای CI/CD و پیادهسازی با استفاده از Gitlab
- تجربه استفاده و نگهداری از دیتابیسها و درک معماریهای HA این حوزه
- تجربه استفاده و نگهداری از سیستمهای Messaging مانند Kafka و RabbitMQ
- تجربه کار با ابزارهای Monitoring و Logging مانند ELK Stack, Prometheus, Grafana
- مسلط به مفاهيم کانتینرها و تکنولوژیهای Orchestration مانند Docker و Kubernetes
- آشنایی با مفاهیم SLI و برقراری SLO در سطح سرویسها
- آشنایی با Distributed Storages مانند Ceph امتیاز محسوب میشود.
- آشنایی با ساختار OpenStack امتیاز محسوب میشود.
Job requirements
- ارتباط فعال با باقی تیم ها جهت مدیریت زیرساخت و حل مشکلات
- طراحی، بهبود و پیادهسازی معماری زیرساخت سرویسها برای پیادهسازی در مقياس و لود بالا
- نگهداری و بهبود سیستمهای Monitoring و Alerting و مدیریت حادثهها
- آنکال بودن در مواقع ضروری و ساعات غیراداری در شیفتهای هفتگی
or
All done!
Your application has been successfully submitted!