監控工程萬建電子介紹監控知識:
1、監控方法
1.了解(jie)監控(kong)對象(xiang):我(wo)們要監控(kong)的對象(xiang)你(ni)是否了解(jie)呢(ni)?比如(ru)CPU到底是如(ru)何工作的?
2.性能基準指標:我們(men)要(yao)監控這個(ge)東西的什么屬性?比(bi)如CPU的使用(yong)率(lv)、負載、用(yong)戶態、內核(he)態、上下文切(qie)換。
3.報警(jing)閾值(zhi)定(ding)義:怎么(me)樣才算(suan)是故障,要報警(jing)呢?比如CPU的負(fu)載到底多(duo)(duo)少算(suan)高,用戶態、內核態分(fen)別跑多(duo)(duo)少算(suan)高?
4.故(gu)障(zhang)處理(li)流程:收(shou)到了故(gu)障(zhang)報警,那么我們(men)怎么處理(li)呢?有什么更高效的(de)處理(li)流程嗎?
2、監控核心
1.發現問題:當系統發生故(gu)(gu)障報(bao)警(jing),我們會收到故(gu)(gu)障報(bao)警(jing)的信息(xi)
2.定(ding)位問題:故(gu)障郵件一般都會寫某某主(zhu)機故(gu)障、具體故(gu)障的內容,我們需(xu)要(yao)(yao)對報警內容進行分析,比如一臺(tai)服務器連不上(shang):我們就(jiu)需(xu)要(yao)(yao)考(kao)慮是網(wang)絡問題、還是負載太(tai)高導致長時間無法連接,又(you)或者某開發觸發了防火墻禁止的相關策略等(deng)等(deng),我們就(jiu)需(xu)要(yao)(yao)去分析故(gu)障具體原(yuan)因。
3.解(jie)決(jue)問題(ti):當然(ran)我們了解(jie)到故障(zhang)的(de)(de)原因后,就需要通過故障(zhang)解(jie)決(jue)的(de)(de)優先級去解(jie)決(jue)該(gai)故障(zhang)。
4.總(zong)結問題:當我們(men)解決(jue)完重大故(gu)障后(hou),需(xu)要對故(gu)障原因以(yi)及防范進行總(zong)結歸納,避(bi)免(mian)以(yi)后(hou)重復出現。