上個禮拜有兩件事讓我頗有感觸,一是美國職場上的升遷,二是關於值班,且讓我再牢騷一番。
前文提到我的饅頭如何發揮影響力,成為組裡的技術領導。他其中一項對自己的要求是,值班的事情就在值班時間內做完。這邊所謂軟體工程師的值班,並不是待在公司裡面24 小時過夜等換班,而是長達一週168 小時的待命狀態。這一週內,值班工程師放下手邊產品開發的工作,負責產品相關的各種技術支援、修補、更新、聯繫。不少組不讓新進工程師負責值班的,除非人力吃緊。我有幸能夠為組裡服務。
PagerDuty 是值班工程師的好夥伴,一旦系統出現狀況,PagerDuty 接受到系統警訊後,會用寄信、傳簡訊、打電話等方式騷擾值班工程師。如果值班工程師在十分鐘內沒有回覆,PagerDuty 就會向上通知主管。
上禮拜它就打了一次小報告。
星期四早上六點起床後,看到小老闆在Slack 上關心昨晚十一點的PagerDuty 警訊。哎,我不留意把手機關靜音了,沒收到警訊。早上去辦公室馬上跟小老闆報告情況:
「FedEx 無法處理一個錯誤地址,導致有一些產品被退貨,但不用擔心,我已經處理好了!」
小老闆聽了臉色一沉,說了一句「這不應該發生的」(This should not happen)
聽到他的回答,我心涼了一半。我知道自己雖然菜,但這種小問題第一時間是可以解決的,不需要在深夜11 點讓小老闆來關切,深覺自己有愧饅頭對我的尊尊教誨…
「工程師的睡眠不應該被這種問題打斷,FedEx 11點也沒在收件的,我們應該處理一下PagerDuty 發佈警訊的優先順序」他接著說。
事後小老闆開了一張ticket, 討論如何分類PagerDuty 收到的警訊,僅有嚴重的問題必須做夜間通報。
Definitely a 🙂 in our retro next week.