Skip to content

Site Reliability Engineer

  • Hybrid
    • Tehran, Tehrān, Iran, Islamic Republic of
  • Technical Product

Job description

  • مسلط به سیستم عامل لینوکس و تجربه نگهداری آن در مقیاس بزرگ

  • دانش کافی در کار با سرویس‌ها و پروتکل‌های شبکه (TCP/IP , TLS , DNS , HTTPS)

  • دانش کافی در مورد Git و GitFlow

  • تجربه کار با یکی از زبان‌های Golang یا Python و اسکریپت نویسی با Bash

  • تجربه کار با ابزارهای Configuration Management مانند Ansible و SaltStack

  • تجربه کار با ساختارهای CI/CD و پیاده‌سازی با استفاده از Gitlab

  • تجربه استفاده و نگهداری از دیتابیس‌ها و درک معماری‌های HA این حوزه

  • تجربه استفاده و نگهداری از سیستم‌های Messaging مانند Kafka و RabbitMQ

  • تجربه کار با ابزارهای Monitoring و Logging مانند ELK Stack, Prometheus, Grafana

  • مسلط به مفاهيم کانتینرها و تکنولوژی‌های Orchestration مانند Docker و Kubernetes

  • آشنایی با مفاهیم SLI و برقراری SLO در سطح سرویس‌ها

  • آشنایی با Distributed Storages مانند Ceph امتیاز محسوب می‌شود.

Job requirements

  • ارتباط فعال با باقی تیم‌ها جهت مدیریت زیرساخت و حل مشکلات

  • طراحی، بهبود و پیاده‌سازی معماری زیرساخت سرویس‌ها برای پیاده‌سازی در مقياس و لود بالا

  • نگهداری و بهبود سیستم‌های Monitoring و Alerting و مدیریت حادثه‌ها

  • آنکال بودن در مواقع ضروری و ساعات غیراداری در شیفت‌های هفتگی

or