Skip to content

Site Reliability Engineer

  • On-site
    • تهران, Fārs, Iran, Islamic Republic of
  • Technical Product

Job description

  • مسلط به سیستم عامل لینوکس و تجربه نگهداری آن در مقیاس بزرگ
  • دانش کافی در کار با سرویس‌ها و پروتکل‌های شبکه (TCP/IP , TLS , DNS , HTTPS)
  • دانش کافی در مورد Git و GitFlow
  • تجربه کار با یکی از زبان‌های Golang یا Python و اسکریپت نویسی با Bash
  • تجربه کار با ابزارهای Configuration Management مانند Ansible و SaltStack
  • تجربه کار با ساختارهای CI/CD و پیاده‌سازی با استفاده از Gitlab
  • تجربه استفاده و نگهداری از دیتابیس‌ها و درک معماری‌های HA این حوزه
  • تجربه استفاده و نگهداری از سیستم‌های Messaging مانند Kafka و RabbitMQ
  • تجربه کار با ابزارهای Monitoring و Logging مانند ELK Stack, Prometheus, Grafana
  • مسلط به مفاهيم کانتینرها و تکنولوژی‌های Orchestration مانند Docker و Kubernetes
  • آشنایی با مفاهیم SLI و برقراری SLO در سطح سرویس‌ها
  • آشنایی با Distributed Storages مانند Ceph امتیاز محسوب می‌شود.
  • آشنایی با ساختار OpenStack امتیاز محسوب می‌شود.

Job requirements

  • ارتباط فعال با باقی تیم ها جهت مدیریت زیرساخت و حل مشکلات
  • طراحی، بهبود و پیاده‌سازی معماری زیرساخت سرویس‌ها برای پیاده‌سازی در مقياس و لود بالا
  • نگهداری و بهبود سیستم‌های Monitoring و Alerting و مدیریت حادثه‌ها
  • آنکال بودن در مواقع ضروری و ساعات غیراداری در شیفت‌های هفتگی

or