RoseHA
RoseHA高可用系統解決方案,由兩臺服務(wù)器和一臺共享存儲設備組成主要硬件環(huán)境,通過(guò)RoseHA持續、穩定、高效的軟件系統,實(shí)現兩個(gè)節點(diǎn)的高可用功能。采用Rose基于共享存儲的高可用解決方案,實(shí)現企業(yè)關(guān)鍵業(yè)務(wù)7×24小時(shí)不間斷運營(yíng),是企業(yè)重要考量。
RoseHA的工作原理
RoseHA雙機系統的兩臺服務(wù)器(主機)都與磁盤(pán)陣列(共享存儲)系統連接,用戶(hù)的操作系統、應用軟件和RoseHA高可用軟件分別安裝在兩臺主機上,數據庫等共享數據存放在存儲系統上,兩臺主機之間通過(guò)私用心跳網(wǎng)絡(luò )連接。配置好的系統主機開(kāi)始工作后,RoseHA軟件開(kāi)始監控系統,通過(guò)私用網(wǎng)絡(luò )傳遞的心跳信息,每臺主機上的RoseHA軟件都可監控另一臺主機的狀態(tài)。當工作主機發(fā)生故障時(shí),心跳信息就會(huì )產(chǎn)生變化,這種變化可以通過(guò)私用網(wǎng)絡(luò )被RoseHA軟件捕捉。當捕捉到這種變化后RoseHA就會(huì )控制系統進(jìn)行主機切換,即備份機啟動(dòng)和工作主機一樣的應用程序接管工作主機的工作(包括提供TCP/IP網(wǎng)絡(luò )服務(wù)、存儲系統的存取等服務(wù))并進(jìn)行報警,提示管理人員對故障主機進(jìn)行維修。當維修完畢后,可以根據RoseHA的設定自動(dòng)或手動(dòng)再切換回來(lái),也可以不切換,此時(shí)維修好的主機就作為備份機,雙機系統繼續工作。
RoseHA實(shí)現容錯功能的關(guān)鍵在于,對客戶(hù)端來(lái)說(shuō)主機是透明的,當系統發(fā)生錯誤而進(jìn)行切換時(shí),即主機的切換在客戶(hù)端看來(lái)沒(méi)有變化,所有基于主機的應用都仍然正常運行。RoseHA采用了虛擬IP地址映射技術(shù)來(lái)實(shí)現此功能?蛻(hù)端通過(guò)虛擬地址和工作主機通訊,無(wú)論系統是否發(fā)生切換,虛擬地址始終指向工作主機。在進(jìn)行網(wǎng)絡(luò )服務(wù)時(shí),RoseHA提供一個(gè)邏輯的虛擬地址,任何一個(gè)客戶(hù)端需要請求服務(wù)時(shí)只需要使用這個(gè)虛擬地址。正常運行時(shí),虛擬地址及網(wǎng)絡(luò )服務(wù)由主服務(wù)器提供。當主服務(wù)器出現故障時(shí),RoseHA會(huì )將虛擬地址轉移到另外一臺服務(wù)器的網(wǎng)卡上,繼續提供網(wǎng)絡(luò )服務(wù)。切換完成后,在客戶(hù)端看來(lái)系統并沒(méi)有出現故障,網(wǎng)絡(luò )服務(wù)仍然可以使用。除IP地址外,HA還可以提供虛擬的計算機別名供客戶(hù)端訪(fǎng)問(wèn)。對于數據庫服務(wù),當有主服務(wù)器出現故障時(shí),另外一臺服務(wù)器就會(huì )自動(dòng)接管,同時(shí)啟動(dòng)數據庫和應用程序,使用戶(hù)數據庫可以正常操作。
RoseHA主要功能特點(diǎn)
【簡(jiǎn)潔直觀(guān)的管理方式】
RoseHA提供了友好直觀(guān)的圖形安裝界面和監控管理界面。通過(guò)直觀(guān)而又方便的Java Applet管理界面,用戶(hù)可以交互式地對集群系統進(jìn)行配置、監控和管理,并可以利用Applet的網(wǎng)絡(luò )特性,通過(guò)網(wǎng)絡(luò )對系統進(jìn)行遠程管理,實(shí)時(shí)地顯示出主機系統及服務(wù)的狀態(tài)。
【靈活的高可用應用模式】
RoseHA支持Active-Active模式和Active-Standby模式。用戶(hù)可指定每臺服務(wù)器的作用(active or standby),指定要監控的服務(wù)和硬件部分,定義指定的服務(wù)發(fā)生故障后要采取的進(jìn)一步行動(dòng)(如是否重新啟動(dòng)該服務(wù)、允許的******啟動(dòng)時(shí)間等)。
【適應復雜網(wǎng)絡(luò )環(huán)境】
1. 在網(wǎng)絡(luò )環(huán)境中,每個(gè)IP與唯一的MAC綁定在一起。而傳統的集群結構下,將致使集群的活動(dòng)IP在不同時(shí)刻綁定不同的MAC地址,導致跨網(wǎng)段通信出現問(wèn)題。為了使集群軟件更好的支持這種網(wǎng)絡(luò )安全級別較高的網(wǎng)絡(luò )環(huán)境,RoseHA提供了支持虛擬MAC地址的功能,使集群環(huán)境IP地址實(shí)現與唯一MAC地址綁定。
2. RoseHA支持IPV4網(wǎng)絡(luò )通信協(xié)議以及未來(lái)適用的IPV6網(wǎng)絡(luò )通信協(xié)議。
【支持動(dòng)態(tài)卷切換機制】
1. 支持Windows 2008 R2以后的平臺上的動(dòng)態(tài)卷,增強卷切換的效率。
2. 支持Linux平臺LVM卷設備切換。
【集群的容錯可靠性】
1. RoseHA集群具有容錯可靠性,RoseHA集群的拓撲包括兩臺服務(wù)器和一臺磁盤(pán)陣列,硬件實(shí)現了容錯可靠。
2. RoseHA具有兩個(gè)核心進(jìn)程,它們互相監控,如果其中一個(gè)進(jìn)程失敗,另一個(gè)進(jìn)程會(huì )立即進(jìn)行恢復,避免了RoseHA自身服務(wù)的單點(diǎn)故障。
3. RoseHA支持Socket和RS232兩種類(lèi)型的心跳,配置多條心跳路徑可以避免心跳的單點(diǎn)故障。
4. 支持仲裁盤(pán),RoseHA提供磁盤(pán)仲裁資源。即使集群節點(diǎn)間通信全部斷開(kāi),也能通過(guò)仲裁資源來(lái)確定集群的運行狀態(tài),避免集群節點(diǎn)間的資源競爭。
【豐富的附加功能】
提供不同的針對特定應用的Agent程序,使服務(wù)監控更切實(shí)際,更加有效。
【系統資源監控】
深度和持續監測系統運行狀態(tài),智能分析系統資源使用情況,保障系統資源環(huán)境的健康穩定(包含CPU,內存) 。
【集群環(huán)境監控】
主備節點(diǎn)上的RoseHA集群服務(wù)通過(guò)IP網(wǎng)絡(luò )鏈路互相通信,傳遞應用程序及主服務(wù)器運行狀態(tài)信息。
當集群服務(wù)因諸如網(wǎng)絡(luò )阻塞、網(wǎng)卡故障、網(wǎng)絡(luò )運營(yíng)服務(wù)中斷等網(wǎng)絡(luò )故障,或者服務(wù)器電源故障、服務(wù)器宕機、系統維護等服務(wù)器故障等原因,無(wú)法在預設的時(shí)間范圍內應答對方節點(diǎn)發(fā)送的心跳信息,都有可能造成RoseHA心跳超時(shí),所以建議管理員配置2條或3條IP網(wǎng)絡(luò )作為私網(wǎng)心跳,避免因網(wǎng)絡(luò )擁塞、服務(wù)器繁忙等非常規性網(wǎng)絡(luò )或服務(wù)器故障,造成集群間通信不暢的情況發(fā)生。

