<menu id="guoca"></menu>
<nav id="guoca"></nav><xmp id="guoca">
  • <xmp id="guoca">
  • <nav id="guoca"><code id="guoca"></code></nav>
  • <nav id="guoca"><code id="guoca"></code></nav>

    主機檢查

    介紹

    主機檢查的基本工作在此處介紹。

    何時執行主機檢查?

    主機由Nagios Core守護程序檢查:

    定期安排的主機檢查是可選的。如果將主機定義中的check_interval選項設置為零(0),則Nagios Core將不會定期執行主機檢查。但是,它將仍然根據監視邏輯的其他部分的需要對主機執行按需檢查。

    當與主機關聯的服務更改狀態時,將進行按需檢查,因為Nagios Core需要知道主機是否也更改了狀態。更改狀態的服務通常是主機可能也已更改狀態的指示。例如,如果Nagios Core檢測到與主機關聯的HTTP服務剛剛從CRITICAL更改為OK狀態,則可能表明該主機剛剛從重新啟動中恢復,并且現在已備份并正在運行。

    主機的按需檢查也作為主機可達性邏輯的一部分進行。Nagios Core旨在盡快檢測網絡中斷,并區分DOWN和UNREACHABLE主機狀態。這些狀態非常不同,可以幫助管理員快速定位網絡中斷的原因。

    按需檢查也作為預測性主機依賴性檢查邏輯的一部分執行。這些檢查有助于確保依賴性邏輯盡可能準確。

    緩存的主機檢查

    通過實現緩存檢查的使用,可以顯著提高按需主機檢查的性能,如果確定相對較新的檢查結果,Nagios Core可以放棄執行主機檢查。有關緩存檢查的更多信息,請參見此處

    依賴關系和檢查

    您可以定義主機執行依賴性,以防止Nagios Core根據一個或多個其他主機的狀態檢查主機的狀態。有關依賴關系的更多信息,請參見此處

    主機檢查的并行化

    計劃的主機檢查是并行運行的。當Nagios Core需要運行計劃的主機檢查時,它將啟動主機檢查,然后返回執行其他工作(運行服務檢查等)。主機檢查在從主要Nagios Core守護程序進行fork()處理的子進程中運行。主機檢查完成后,子進程將把檢查結果通知主Nagios Core進程(其父進程)。然后,主要的Nagios Core流程將處理檢查結果并采取適當的措施(運行事件處理程序,發送通知等)。

    如果需要,還可以并行運行按需主機檢查。如前所述,Nagios Core如果可以使用相對較新的主機檢查中的緩存結果,則可以放棄按需主機檢查的實際執行。

    當Nagios Core處理計劃的和按需的主機檢查結果時,它可能會啟動(輔助)其他主機的檢查。可以出于兩個原因啟動這些檢查:預測依賴性檢查以及使用網絡可達性邏輯確定主機的狀態。啟動的輔助檢查通常并行運行。但是,您應該意識到一個大例外,因為它可能會對性能產生負面影響…

    max_check_attempts值設置為1的主機可能會導致嚴重的性能問題。原因?如果Nagios Core需要使用網絡可達性邏輯來確定其真實狀態(以查看它們是否處于DOWN或UNREACHABLE狀態),則它將必須對主機的所有直接父母進行序列檢查。重申一下,這些檢查是串行運行的,而不是并行運行的,因此可能會嚴重影響性能。因此,我建議您始終在主機定義中為max_check_attempts偽指令使用大于1的值。

    主辦國

    被檢查的主機可以處于三種不同狀態之一:

    • 向上

    • 無法到達

    主辦國確定

    主機檢查由插件執行,插件可以返回OK,WARNING,UNKNOWN或CRITICAL狀態。Nagios Core如何將這些插件返回代碼轉換為UP,DOWN或UNREACHABLE的主機狀態?讓我們來看看。

    下表顯示了插件返回代碼如何與初始主機狀態相對應。完成一些后處理(將在后面進行描述),然后可以更改最終主機狀態。

    插件結果 初步主辦國
    向上
    警告 上或下*
    未知
    危急

    注意:警告結果通常表示主機已啟動。但是,如果啟用了use_aggressive_host_checking選項,則將警告結果解釋為主機已關閉。

    如果主機的初始狀態為DOWN,Nagios Core將嘗試查看主機是否真的為DOWN或是否為UNREACHABLE。DOWN和UNREACHABLE主機狀態之間的區別很重要,因為它使管理員可以更快地確定網絡中斷的根本原因。下表顯示了Nagios Core如何根據主機父級的狀態做出最終狀態確定。主機的父母在主機定義的parents指令中定義。

    初步主辦國 家長所在州 最終主辦國
    至少有一位父母
    所有父母都不在家或無法聯系 無法到達

    有關Nagios Core如何區分DOWN和UNREACHABLE狀態的更多信息,請參見此處

    主機狀態更改

    如您所知,主機并非總是處于一種狀態。事情中斷了,補丁被應用了,服務器需要重啟。當Nagios Core檢查主機狀態時,它將能夠檢測到主機何時在UP,DOWN和UNREACHABLE狀態之間切換,并采取適當的措施。這些狀態更改導致不同的狀態類型(HARD或SOFT),這可以觸發事件處理程序的運行和通知的發送。檢測和處理狀態更改是Nagios Core的全部目的。

    當主機更改狀態的頻率太高時,它們被視為“拍動”。主機波動的一個很好的例子是服務器,一旦操作系統加載,該服務器就會自發重啟。這總是很有趣的情況。Nagios可以檢測主機何時開始震蕩,并且可以抑制通知,直到震蕩停止并且主機的狀態穩定為止。可以在此處找到有關襟翼檢測邏輯的更多信息。

    本文章首發在 網安wangan.com 網站上。

    上一篇 下一篇
    討論數量: 0
    只看當前版本


    暫無話題~
    亚洲 欧美 自拍 唯美 另类