不管是在地端亦或是雲端,IT人員最重要的一份工作,即是監控機器的運作情況,然而阿里雲為用戶提供了開箱即用的企業級開放型一站式監控解決方案,雲監控包含了IT基礎架構監控及外網網路品質監控,更提供基於事件觸發或自定義指標的業務監控,使用雲監控不但可以提升系統可靠性,還可以降低企業IT維運的監控成本。

產品架構

雲監控透過Agent收集各項數據,接著配合預設好的Metric及Event觸發Alert,再透過各種不同的通知方式來告知IT或是觸發Alert後自動執行特定服務。

雲監控透過Agent收集各項數據,接著配合預設好的Metric及Event觸發Alert,再透過各種不同的通知方式來告知IT或是觸發Alert後自動執行特定服務。

實務操作

  1. Dashbord
    進入雲監控的服務後透過Dashboard看到Cloud Service的各項監控圖表(CPU Usage、Memory Usage、System Average Load),更可依照個人的服務、使用習慣等製作自己獨一無二的Dashboard。
進入雲監控的服務後透過Dashboard看到Cloud Service的各項監控圖表(CPU Usage、Memory Usage、System Average Load),更可依照個人的服務、使用習慣等製作自己獨一無二的Dashboard。
  1. Alert
    創建Alert Rule 對特定指標設定數值標準或是基於特定事件即觸發Alert,觸發後會依照設定好的資訊發送短信、mail等等給特定聯絡人。
創建Alert Rule 對特定指標設定數值標準或是基於特定事件即觸發Alert,觸發後會依照設定好的資訊發送短信、mail等等給特定聯絡人。

在創建Alert Rule時更可開啟進階設置,在Alert觸發時使用其他的Cloud Sevice。

在創建Alert Rule時更可開啟進階設置,在Alert觸發時使用其他的Cloud Sevice。
  1. 實際驗證
    透過Stress指令針對vm本身做壓力測試,可看到在CPU使用率連續3個週期達到50%後,會觸發Alert並發送mail告知聯絡人。
透過Stress指令針對vm本身做壓力測試,可看到在CPU使用率連續3個週期達到50%後,會觸發Alert並發送mail告知聯絡人。
透過Stress指令針對vm本身做壓力測試,可看到在CPU使用率連續3個週期達到50%後,會觸發Alert並發送mail告知聯絡人。

結語

透過阿里雲自帶的雲監控可以有效的監控到阿里雲的服務,無論是CPU使用率、RAM使用率甚至系統付、網路流量等等等,更可透過Alert並串接mail、通訊軟體等等方式來通知IT人員,大大降低了維運成本,且更可透過監控紀錄來分析系統是否需要優化等等,實在是IT人員的一大福音。

*本文由宏庭架構師所撰寫,同步刊登於iThome 鐵人賽專區

.>更多阿里雲相關內容,再且密切追蹤阿里雲架構師專欄


Reference

Cloud Monitor介紹