硬件運(yùn)維工程師是做什么的
1、質(zhì)量:保障并不斷提升服務(wù)的可用性,確保用戶數(shù)據(jù)安全,提升用戶體驗(yàn)。2、效率:用自動(dòng)化的工具/平臺(tái)提升軟件在研發(fā)生命周期中的工程效率。
3、成本:通過技術(shù)手段優(yōu)化服務(wù)架構(gòu)、性能調(diào)優(yōu);通過資源優(yōu)化組合降低成本、提升ROI。
硬件運(yùn)維工程師日常工作
對(duì)比不同品牌的設(shè)備性能及成本,進(jìn)行新設(shè)備采購,并做好硬盤等設(shè)備的預(yù)熱工作(有時(shí)新買的需要一個(gè)磨合期)。安裝設(shè)備與布線,包括服務(wù)器,交換機(jī),路由器,網(wǎng)線、電線的規(guī)劃。這個(gè)規(guī)劃是要考慮軟件的需求的,比如有一些服務(wù)器之間要能夠連通,不能根據(jù)完全根據(jù)個(gè)人審美。
備份策略的制定與實(shí)施:服務(wù)器是不能一個(gè)蘿卜一個(gè)坑的,不然壞掉一臺(tái)就會(huì)影響用戶使用了,因此要在考慮網(wǎng)絡(luò)聯(lián)通的前提下,規(guī)劃好哪些機(jī)器是主要機(jī)器,用來提供服務(wù),哪些是對(duì)應(yīng)的備用機(jī)器,并配合軟件工程師或軟件運(yùn)維做好配置。
巡檢:我們就以一千臺(tái)服務(wù)器為例吧,每天去低溫環(huán)境里待幾個(gè)小時(shí)好像也不是高科技行業(yè)該做的工作。因此我們需要在服務(wù)器上安裝相應(yīng)的軟件來幫我們做監(jiān)控,并能夠發(fā)現(xiàn)問題,自動(dòng)報(bào)警;硬件也是同理,我們不能拿電筆去測(cè)每個(gè)插座有沒有電,是要靠電路監(jiān)控的。
維護(hù):并不是有了自動(dòng)化監(jiān)控就沒有其它事情了,而是我們要不斷的根據(jù)實(shí)際情況調(diào)整自動(dòng)化的策略。同時(shí),出現(xiàn)的問題要處理,必要的走到每臺(tái)機(jī)器前例行檢查也是少不了的,發(fā)現(xiàn)異常的響動(dòng)這些,就要及時(shí)維修。
新增:業(yè)務(wù)發(fā)展是好事,用戶多了,需要的資源多了,就要規(guī)劃是買新的服務(wù)器,還是只買cpu或者內(nèi)存,加到現(xiàn)有的服務(wù)器中。
硬件運(yùn)維工程師工作職責(zé)
1. 負(fù)責(zé)利用監(jiān)控平臺(tái)進(jìn)行線上系統(tǒng)的7*24運(yùn)行保障;2. 對(duì)發(fā)生告警或故障事件,能及時(shí)判斷嚴(yán)重等級(jí),并根據(jù)流程規(guī)范進(jìn)行問題處置;
3. 響應(yīng)報(bào)障電話、郵件,跟蹤管控故障的處理,及時(shí)完成信息記錄歸檔;
4. 輔助進(jìn)行日常運(yùn)維相關(guān)活動(dòng)。