Domino Mail 系統的多級監控

genusBIT發表於2009-04-07

建立 Mail Cluster 系統

首先,有效利用 Domino Cluster 系統的特性構建一個強壯的 Mail 系統,Domino Cluster 可以為使用者提供持續穩定的訪問 , 可以均衡 mail 伺服器負載,還可以實現災難備份。根據企業的不同規模,可以採用不同的構建方案。

  • 小型企業,兩臺伺服器,使用者數不多,可以採用雙機熱備的方案。在日常使用中可以採用兩種方式:
    • 一主一備方式:所有的使用者同時訪問一臺主機,另外一臺作為災難備份機,當主機發生故障是,自動切換到備份機上。以 100 個使用者為例,所有使用者的 home server 都指向主伺服器。
    • 平衡負載方式:兩臺伺服器同時提供服務,均衡負載,互為備份,一旦一臺伺服器發生故障,另外一臺接管所有的服務。以 100 個使用者為例,50 個使用者的 home server 都指向一臺伺服器,剩餘的使用者指向另一臺伺服器。

      圖 1. 平衡負載
      圖 1. 平衡負載

  • 大中型企業,多臺伺服器,大量使用者。可以採用分散熱備的方案。下圖很好的解釋了這種運做方式。四臺 Mail 伺服器,1200 個使用者,每臺裝置註冊 300 個使用者,分別有 100 個使用者與其他三臺伺服器備份。如果一臺裝置發生故障,其他三臺機器各自分攤其中的 100 個使用者,這種方案使每臺機器的負載從 25% 提高到 33%,升幅不大,系統響應速度不會明顯降低。

    圖 2. 多臺伺服器負載
    圖 2. 多臺伺服器負載

有兩種方法可以為使用者 Mail 資料庫建立 Replica 。

  • 在註冊新使用者時,直接在 Mail 欄目直接指定 Mail File Replicas 伺服器。
  • 為已有使用者建立 Replica,用 Administrator – > File (Tab) -> 左側 Mail folder-> 選中一個或多個 Mail file-> 拖動到左側 Server Pane 中 Cluster 機器上。

    利用 Domino 自有的監控機制,逐級主動監控 Mail 系統

    在建立起企業 Mail 系統之後,管理員可以啟用郵件監控工具 Message tracking 來跟蹤、分析、 優化郵件系統的效能。等系統穩定以後,日常的主要工作則集中在系統突發性事件的處理上,如何能知道 Mail 系統的突發事件那?換句話說,迅速判斷出 Mail 系統出現問題的部分,採取相應的措施恢復系統。

    在介紹具體的監控的手段之前,我們先簡單介紹一下 Domino Mail 系統的工作原理。 Domino 郵件系統的核心是 Router 任務,它具備傳送、傳輸兩種功能:傳送是指把 MAIL.BOX 中的 Message 傳送到使用者郵箱或資料庫中 ; 傳輸則是完成伺服器之間 MAIL.BOX 的訊息傳輸。郵件路由分外部與內部兩種,總體來說與外部通訊支援 SMTP、POP3、IMAP 協議,對內通訊則使用 NRPC 或 SMTP,由 Router 根據郵件內容格式(MIME/CD)和郵件地址格式(Internet Address 帶 @ / Notes Address)來選擇路由協議。下圖很好的解釋了郵件的傳送的工作過程。


    圖 3. 郵件傳送過程
    圖 3. 郵件傳送過程

    在《 IBM Lotus Domino Administrator help 》中有對 Cluster 系統監控的介紹,這裡我們就不累述了。

    利用 Event monitor 機制

    一個合理的企業 Mail 架構只是設定特定的伺服器與外界通訊,因此監控郵件系統可以轉化為監控 Mail 各種協議埠和 Router 任務。依據這條線索,我們可以利用 Domino 提供了多種監控途徑,實現 Mail 系統的多級監控。以下圖為例,選擇 SMTP 協議,模擬企業 Mail 系統。 Mail2 負責傳送郵件到 Internet,Mail3 負責從 Internet 接收郵件,這裡需要做如下的配置。

    • Enable 伺服器 Mail2 “ SMTP used when sending messages outside of the local Internet domain ”。
    • Enable 伺服器 Mail3 “ the SMTP listener task ”

    圖 4
    圖 4

    我們選用 Mail Routing Event Monitor 和 TCP Server Generator 分別監控 Mail 伺服器的 Router 任務與偵聽郵件服務埠。這兩種監控都是利用伺服器的 ISpy 任務實現的,當配置好 Event Generator 後,ISpy 就會定時傳送探測訊息到指定郵箱,檢測 Router 任務; Ispy 也會定時偵測伺服器的服務埠。一旦測試失敗,則傳送通知訊息。既然我們的主要任務是監控郵件服務的,所以在選擇事件通知方式時最好不要選擇 Mail 傳送,因為 Router 一旦出現問題,管理員是不能及時收到告知訊息的。


    圖 5-1

    圖 5-2

    圖 5-3

    下面介紹的兩種配置方案,在小型企業是可以直接應用的。

    1. 配置一,Mail 伺服器各自監控自己,選擇 Relay to other server 事件通知方式,存入統一的資料庫中。

      圖 6
      圖 6

    2. 配置二,選擇一臺伺服器(Mail1)路由監控的主伺服器,由這臺伺服器傳送偵測訊息,並把所有伺服器的事件通知訊息統一儲存到監控伺服器的資料庫中。

    利用 DDM 機制(7.0 以上)

    從 Domino 7.0 開始,增加了新 DDM (Domino Domain Monitoring) 功能。 DDM 的顯著特點是:

    • 以 Server Collection Hierarchy 的層級方式,利用複製公式逐級上傳事件資訊,集中儲存單個 Domain 乃至跨 Domain 事件資訊。
    • 提供解決事件問題的幾種可能方案,幫助管理員迅速決策。
    1. 在 Event4.nsf 中建立一個 Server Collection Hierarchy 。 在下圖中,w704spr 集中收集伺服器 a704spr、l704spr、s704spr 的事件資訊。

      圖 7
      圖 7

      此時 DDM 資料庫的複製設定中 Advanced 會自動生成複製選擇公式。



      圖 8
      圖 8

    2. DDM 提供了更加細化的 Probe,下圖的分類增加了 NRPC Routing Status、SMTP Process State、Transfer Queue Check 等 Probe 型別,相對於 Event Generator,事件的型別更精細準確。

      圖 9
      圖 9

    3. 事件通知資訊會存入到 ddm.nsf 資料庫中,結果中包含了事件引起的可能原因與解決方法。

      圖 10
      圖 10

    由此可見,DDM 幫助管理員簡化了管理流程,提高了故障診斷效率。

    與第三方監控軟體的結合

    於第三方監控軟體結合實現 Mail 系統監控,在事件產生的方式上可分為兩種方式:主動傳輸事件訊息和被監控方式。

    Domino DDM/Event, 主動向第三方監控軟體傳輸事件訊息

    Domino 從 7.0 版本起,提供了向 Tivoli Enterprise Console 傳輸 DDM 事件資訊的功能,但事件型別僅僅侷限於 Operating System probe 。 並不能滿足 Mail 監控的需要,從 8.0 開始,任何一種 Event 事件型別都能通過格式轉化功能,轉化成 TEC 格式,傳送到 TEC 伺服器。除了在 Tivoli Server 端設定一個基於允許接受 Domino Event 的 Rule 外,還需配置 Domino Server Configurations 中的 Basics, 啟用 Enable Logging to Tivoli Enterprise Console,另外就是修改 Event handler 中 Notification Method 為 Forward event to Tivoli Enterprise Console 。


    圖 11
    圖 11-1

    圖 11-2

    利用 Domino 提供的 C++ API,編寫監控 Domino 的特定服務的 Probe,部署到第三方監控軟體上

    企業使用者可能部署了第三方監控產品,比如 HP OpenView 等其他產品 。目前,Domino 不提供直接傳送到這類監控產品,我們可以利用 Domino C++ API, 遵循前面所述的偵測特定服務及埠的原則,測試郵件是否是否成功。按照監控產品的 Probe 開發規範,開發並部署監控 Domino 的 Probe,主動偵測 Mail 服務及埠。一樣可以實現 Domino Mail 系統監控。

    以上所述的三種監控方式(Event、DDM、與第三方監控軟體的結合),為 Mail 系統管理員提供了發現問題,解決問題的途徑。

    結論

    Domino 系統還提供了許多其它監控手段幫助使用者管理維護系統,我們這裡只是針對 Domino 的 Mail 系統這一主體,闡述了利用 Cluster 技術及監控手段為使用者構建強壯的 Mail 系統的一些方法。在實際的生產環境中,還有其他許多監控功能值得的我們發掘,幫助使用者解決問題。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/14751907/viewspace-586494/,如需轉載,請註明出處,否則將追究法律責任。

相關文章