當前位置:學問谷 >

職場範例 >面試 >

運維的職責和過程

運維的職責和過程

運維一般是指對大型組織已經建立好的網絡軟硬件的維護,其中傳統的運維是指信息技術運維(IT運維)。所謂IT運維管理,是指單位 IT 部門採用相關的方法、手段、技術、制度、流程和文檔 等,對IT 運行環境(如軟硬件環境、網絡環境等)、IT 業務系統和 IT 運維人員進行的綜合管理。

運維的職責和過程

隨着信息化進程的推進,運維管理將覆蓋對整個組織運行,進行支持的管理信息系統涵蓋的所有內容,除了傳統的IT運維,還拓展了業務運維和日常管理運維。其參與的對象也從IT部門和人員,拓展到組織的管理層和各部門,及其相關的業務骨幹。

運維的最終結果是對軟件運行中各種性能的維護。

職責

對於初創公司,運維部和系統部一般是合二為一的,相關工作由同一批人負責,界限可能不是很明顯。大型公司對運維工作的要求更高,需要有更精細的分工,因此機房/網絡/操作系統相關的底層工作分離出來由專人負責,成為系統管理部,而上層和應用產品相關的工作則由運維負責,成為運維部。以下從互聯網產品生命週期和運維涉及的技術分別來看分工較細的大型互聯網公司中運維工作的職責。

過程

運維的'職責覆蓋了產品從設計到發佈、運行維護、變更升級及至下線的生命週期,各個階段的職責包括:

發佈前

這個階段運維工程師的職責是參與設計並把關運維准入,主要包括:

(1) 產品的業務熟悉;

(2) 產品架構設計的合理性評估,包括是否存在單點,是否可容錯,是否有強耦合等,同時需要提供產品設計的合理性建議以使產品能夠滿足上線發佈並穩定運行的基本要求;

(3) 資源評估,包括所需的服務器資源、網絡資源以及資源的分佈等,同時把關產品對資源預算申請的合理性,控制服務成本;

(4) 資源就位,將申請的服務器及基礎環境/域名準備就位。

產品發佈

這個階段運維工程師負責發佈的具體工作,將具體的軟件和系統/硬件資源整合形成產品並對外提供服務。

對於已在線服務的更新也屬於發佈範疇,這個時候的產品發佈一般要保障在線發佈,在不中斷對外服務的情況下完成產品的升級。對於大型複雜的變更也存在中止服務部署完成後再重新提供服務的情況,但這種情況需要運維工程師通過儘可能的技術手段來避免。

產品維護

這個階段的主要工作包括:

(1) 監控:對服務運行的狀態進行實時的監控,隨時發現服務的運行異常和資源消耗情況;輸出重要的日常服務運行報表以評估服務/業務整體運行狀況,發現服務隱患;

(2) 故障處理:對服務出現的任何異常進行及時處理,儘可能避免問題的擴大化甚至中止服務。這之前運維工程師需要針對各類服務異常,如機房/網絡故障、程序bug等問題制定處理的預案,問題出現時可以自動或手動執行預案達到止損的目的。除了日常小故障外,運維工程師還需要考慮產品不同程度受損情況下的災難恢復,包括諸如地震等不可抗力導致大規模機房故障、在線產品被刪除等對產品造成致命傷害的情況。

容量管理:包括服務規模擴張後的資源評估、擴容、機房遷移、流量調度等規劃和具體實施。

產品性能

產品對外提供服務最重要的一點是用户體驗,用户體驗中非常重要的是產品的可用性和響應速度。而如何用最合理的資源(如機器、帶寬等)支持產品提供高可用和高速度的用户體驗,這也是運維工程師的重要職責。

標籤: 運維
  • 文章版權屬於文章作者所有,轉載請註明 https://xuewengu.com/flzc/mianshi/jdjqed.html