Categories
程式開發

混沌工程在醫療保健領域應用:從敏感的工作負載入手


本文要點:

  • 雖然混沌工程是一種已被證明可以提高系統彈性的技術,但當涉及到關鍵系統時,涉眾通常不願意引入這一實踐。
  • 對於關鍵系統,最好首先在開發/測試類的環境中進行實驗,將實際風險和感知風險都降到最低。當你從這些早期實驗中了解到新東西時,你可以向涉眾解釋說,生產環境是一個更大、更複雜的環境,可以進一步從這種實踐中獲益。
  • 使用真實的生產流量,而不是合成作負載,可以提高這些在早期階段進行的實驗的有效性。
  • 良好的混沌工程實踐可以幫助你提高系統的彈性和事件發生時的可觀測性。

近年來,人們對混沌工程越來越感興趣。它定義了一種有價值的實踐,通過接受系統將會失敗的事實來提高系統的可靠性。雖然關於如何應用這種方法的文獻和討論比比皆是,但當系統被視為“關鍵”系統或太重要而不能失敗時,人們往往就會產生猶豫。儘管在關鍵系統中應用此方法可能有更令人信服的理由,但是可以預見,這些系統的涉眾對任何可能增加風險的新事物都很敏感。在本文中,我將分享我們Cerner公司(一家醫療保健信息技術公司)的團隊在我們的系統中引入這一實踐時找到的一種有效的方法。

組織工作

在你開始嘗試開展這些類型的實驗之前,你希望確保系統涉眾就這個方法達成了共識。這在早期階段是很重要的,因為你的一些發現可能會改變你的軟件交付時間表。你希望確保他們理解這個開發過程中新增加的部分,並且這些發現可能比其他計劃好的開發工作具有更高的優先級。這就像在生產事件中發現的可靠性問題優先於其他計劃好的特性。你通過混沌測試發現的問題可能同樣重要,但你是主動發現它們,而不是在實際的事件中被動地發現它們。

原文鏈接:【https://www.infoq.cn/article/icPYYjbW9rR1lulKStOC】。未經作者許可,禁止轉載。