首頁>>>技術>>>CRM  CRM產(chǎn)品

刀片服務器在移動業(yè)務系統(tǒng)中應用

趙澤 2009/08/13

一、項目背景和問題的提出

  河南移動業(yè)務支撐系統(tǒng)遵循集團總部BOSS3.0整體規(guī)劃和規(guī)范,已經(jīng)基本完成相關部署工作,包含客戶服務應用部署、BOSS與DSMP接口改造、欠費風險控制、門戶網(wǎng)站業(yè)務和數(shù)據(jù)一致性管理機制。另外進一步完善和明晰河南移動BOSS系統(tǒng)的體系結構、應用軟件結構、系統(tǒng)邊界和外部接口、系統(tǒng)功能及系統(tǒng)指標等基本定位與要求,從而為河南移動業(yè)務組織、管理及市場經(jīng)營、客戶服務等工作提供持續(xù)、有效的運營支撐。系統(tǒng)改造完成后,將支撐河南移動4000萬計費用戶話務量增長以及業(yè)務發(fā)展的要求,滿足其對集團類業(yè)務、數(shù)據(jù)業(yè)務、奧運業(yè)務和其他新業(yè)務快速開發(fā)和上線的要求。

  2009年,隨著中國電信、中國聯(lián)通3G業(yè)務的逐步推廣,三大電信運營商相繼推出各自的3G移動品牌,中國移動作為中國最大的電信運營商,將面臨中國電信和中國聯(lián)通在移動通信行業(yè)上的白熱化競爭,在移動通信市場3G產(chǎn)品同質(zhì)化日益嚴重的情況下,中國移動將持續(xù)貫徹王建宙掌門人精細化管理和臻于至善的方針,通過提高服務水平和管理水平,發(fā)揮中國移動信息服務專家的品牌優(yōu)勢,保持在競爭中的優(yōu)勢。

  河南作為中國的人口大省,移動通信運營的競爭將更加激烈,河南移動如何在支撐系統(tǒng)建設過程中引入先進的系統(tǒng)建設思路和技術,建立一個能夠滿足不斷增長和變化的業(yè)務需求的系統(tǒng)架構,這套系統(tǒng)架構易于管理和維護,并在最大程度上降低設備采購成本和運營成本?

1.問題分析和解決思路

  1.1 原業(yè)務支撐系統(tǒng)的建設模式

  建設BOSS3.0以前,河南移動的業(yè)務支撐系統(tǒng)全部選用UNIX小型機作為主服務器設備,UNIX小型機具有處理能力高,單機穩(wěn)定性好的優(yōu)點,但同時,UNIX小型機也存在采購成本高、運行維護成本高、運行維護相對復雜等問題。隨著業(yè)務支撐系統(tǒng)能力要求不斷提升,UNIX小型機的高成本成為系統(tǒng)建設的瓶頸。"降低TCO成本、提升性能、節(jié)能減排"成為河南移動業(yè)務支撐系統(tǒng)建設關注的重點。

  1.2 業(yè)務支撐基礎架構設施的建設思路

  河南移動一直在追蹤最新的互聯(lián)網(wǎng)技術與硬件技術的發(fā)展,發(fā)現(xiàn)互聯(lián)網(wǎng)企業(yè)系統(tǒng)架構模式值得借鑒:互聯(lián)網(wǎng)應用多運行于PC服務器、刀片服務器等低端設備上,系統(tǒng)通過先進的技術架構與集群部署方式支撐大量在線訪問、交易并保持高效、穩(wěn)定的運行,典型的如Google、淘寶均使用刀片集群作為運行平臺。河南移動借鑒互聯(lián)網(wǎng)系統(tǒng)架構思路,結合系統(tǒng)特點對業(yè)務支撐系統(tǒng)架構進行優(yōu)化、創(chuàng)新,實現(xiàn)了將CRM應用部署于刀片服務器機群的創(chuàng)新。

  實現(xiàn)CRM應用基礎架構的優(yōu)化需要在軟件、硬件上進行縝密論證:

  在軟件技術層面上,河南移動BOSS3.0的CRM系統(tǒng)采用三層軟件架構,基于亞信公司AppFrame平臺設計、開發(fā)。AppFrame平臺采用分布式架構設計,底層采用分布式EJB實現(xiàn),整體系統(tǒng)架構完全支持集群化、分布業(yè)務處理。AppFrame平臺完全基于J2EE開發(fā),具備良好的可移植性,應用組件可以運行于任何支持J2EE的操作系統(tǒng)上。AppFrame平臺提供了多種應用系統(tǒng)級容錯機制,通過會話復制、服務可用性判斷、路由分發(fā)、應用自適應調(diào)整、災備切換等方式保證系統(tǒng)穩(wěn)定。AppFrame平臺提供Deploy機制和應用監(jiān)控機制,使基于該平臺的應用具備自動快速部署能力和分布式應用的集中監(jiān)控、跟蹤能力;贏ppFrame平臺的CRM系統(tǒng)具備了"分布式處理能力、跨平臺運行能力、系統(tǒng)級容錯能力、集群部署能力、集中監(jiān)控能力"。上述能力的具備,使河南移動CRM系統(tǒng)具備了運行于刀片機群了條件。

  在硬件設備層面,隨著服務器技術的發(fā)展,刀片服務器技術日趨成熟。刀片服務器是一種高密度服務器,專為實現(xiàn)數(shù)據(jù)中心的便利性而打造。在標準高度的機架式機箱內(nèi)可插裝多個卡式的服務器單元,實現(xiàn)高可用和高密度。每一塊"刀片"實際上就是一塊系統(tǒng)主板,它們可以通過"板載"硬盤啟動自己的操作系統(tǒng),如Windows、Linux等,類似于一個個獨立的服務器,在這種模式下,每一塊母板運行自己的系統(tǒng),服務于指定的不同用戶群,相互之間沒有關聯(lián),不過,管理員可以使用系統(tǒng)軟件將這些母板集合成一個服務器集群。刀片服務器和傳統(tǒng)服務器相比具有很多優(yōu)勢:適用于服務器集群;低成本;線纜大規(guī)模地減少;低功耗;模塊化,實現(xiàn)了物理"即插即用"和"即購即換"處理的高效性。

  結合先進的軟件、硬件技術,CRM系統(tǒng)應用服務器替換為刀片服務器集群成為可能。新的CRM系統(tǒng)架構將具備由冗余節(jié)點方式提供的高可靠性,一旦單臺刀片節(jié)點發(fā)生故障,應用系統(tǒng)將自動切換至其他節(jié)點提供服務;支持通過擴充應用服務器數(shù)量的方式擴展業(yè)務處理能力。最為重要的是,這種新的BOSS基礎架構設備投資低于采用小型機方案的數(shù)倍。

2 業(yè)務支撐系統(tǒng)引入刀片服務器的技術方案

  河南移動BOSS3.0 CRM系統(tǒng)采用三層架構部署,分別為前端業(yè)務接入服務器、應用服務器和數(shù)據(jù)庫服務器,網(wǎng)絡拓撲圖如下:


  1) 接入服務器:接入服務器為營業(yè)系統(tǒng)提供自建營業(yè)廳、合作營業(yè)廳、代辦點、連鎖店等所有的營業(yè)終端接入服務,以及電子渠道等營業(yè)相關業(yè)務接入,通過網(wǎng)頁的形式展現(xiàn)。前端訪問請求可以通過負載均衡器,分配訪問量到各個WEB Server。這樣,即使有某臺Server出現(xiàn)故障,其他Server將繼續(xù)提供服務,接入服務器群主要采用HP ProLiant BladeSystem刀片服務器系統(tǒng),機型是HP Blade System BL465c G5, BL465c 具有AMD雙處理器與標準 1U 機架安裝式服務器相同的特性,該產(chǎn)品集成了節(jié)能的計算功能和高密度性、擴展的內(nèi)存和 I/O,極大地提高了性能。此款均衡架構帶有四核 AMD Opteron(皓龍)處理器、DDR2 內(nèi)存、串行硬盤、多功能千兆網(wǎng)絡支持和多 I/O 卡,可為您提供一個適合多種應用的高性能系統(tǒng)。同時,外形小巧的 BL465c 中還包括確保高可用性的特性,如熱插拔硬盤驅動器、內(nèi)存交錯、嵌入式 RAID 功能、以及提高的遠程 Lights-Out 管理。采用HP C7000機箱,10U高,可放16個半高或8個全高的刀片服務器,

  2) 應用服務器:在應用服務器上部署中間件,提供營業(yè)業(yè)務處理邏輯,并連接后端數(shù)據(jù)庫服務器,應用服務器群集通過中間件提供并行處理方式,提高系統(tǒng)的可用性和可擴展性,應用服務器采用HP Blade System BL685c G5刀片服務器,HP ProLiant BL685c具有極密集 4 處理器刀片式服務器的杰出性能,包括四核處理器、大內(nèi)存容量和同類設備中更出色的網(wǎng)絡連接:最多 4 個 AMD Opteron(皓龍)8300 四核系列處理器,具有 64 位四核計算功能以及業(yè)界領先的每瓦性能和每瓦性價比;支持 AMD Dual Dynamic Power Management 技術,以優(yōu)化設備性能、降低設備功耗;16 個 DIMM 插槽可支持高達 128GB ECC 667MHz 寄存式 DDR2 內(nèi)存,可用于內(nèi)存密集型應用;2 個嵌入式多功能千兆網(wǎng)卡帶有 TCP/IP 卸載引擎 (TOE) 和 iSCSI 支持;2 個嵌入式千兆以太網(wǎng)網(wǎng)卡;3 個中間件 I/O 擴展插槽可安裝配置選件,例如多功能千兆網(wǎng)卡、1GB 和 10GB 千兆以太網(wǎng)網(wǎng)卡、光纖通道和 Infiniband。

  3) 數(shù)據(jù)庫服務器:直接與應用服務器進行數(shù)據(jù)交換,應用服務器訪問數(shù)據(jù)庫進行數(shù)據(jù)操作,數(shù)據(jù)庫服務器采用RAC方式提供性能和可靠性的保證,數(shù)據(jù)庫服務器采用UNIX小型機。

在進行CRM應用服務器替換為刀片服務器的同時,CRM應用、部署進行了相應的優(yōu)化、調(diào)整,保證設備替換后系統(tǒng)運行的高性能、高穩(wěn)定性:

  1) CRM應用優(yōu)化。針對應用部署的集群化,優(yōu)化應用發(fā)布模塊,實現(xiàn)應用分布式、自動化部署。優(yōu)化系統(tǒng)監(jiān)控模塊提供對分布式系統(tǒng)應用追蹤、監(jiān)控功能,實現(xiàn)對服務、事物/數(shù)據(jù)庫連接、系統(tǒng)訪問、SQL的多方面監(jiān)控。及時發(fā)現(xiàn)問題和缺陷并進行優(yōu)化調(diào)整。如:服務跟蹤功能可以實時進行營業(yè)員前臺操作、后臺服務調(diào)用、數(shù)據(jù)庫數(shù)據(jù)操作的整個操作軌跡的跟蹤、分析。

  2) 應用整合。CRM應用架構整合所有業(yè)務功能,而不是原有的一套業(yè)務屬性對應一套業(yè)務系統(tǒng)。在每臺服務器上均部署相同的應用,通過設置實現(xiàn)不同服務器/業(yè)務域實現(xiàn)不同的功能;單個模塊或者功能點的失效、升級或者failover通過模塊控制進行設置。

  3) 應用部署集群化。CRM應用采用集群部署,將若干服務器設置為一個功能域,為特定的接入渠道服務;同時,同一集群的刀片分布于不同的機框中,避免一個機柜故障導致整個應用集群的不可用。采用分散部署的方式可以在單個進程/設備/機柜不可用情況下由其他設備進行應用分擔,任一點出現(xiàn)問題,不會造成系統(tǒng)整體影響問題,提高系統(tǒng)的可用性。

  4) 應用部署自適應調(diào)整機制。不同應用集群應用負載設置性能壓力閾值,當某個集群壓力超過閾值將自適應/手工進行調(diào)整,使用備用集群或其它集群部分資源進行負載分擔。當業(yè)務量降低,又會調(diào)整回去。通過自適應調(diào)整機制均衡各應用集群的能力。

  5) 設置備用刀片集群。當生產(chǎn)設備故障時可以將應用接入到備用集群;同時,在應用系統(tǒng)升級、生產(chǎn)設備檢修時也可以將應用切換到備用集群上。通過備用刀片集群的設置提升了系統(tǒng)的穩(wěn)定性和可維護性。

3.業(yè)務支撐系統(tǒng)應用刀片服務器效果分析

  3.1 降低購置成本

  如果用8臺機架式服務器和8臺刀片服務器相比較,帶有光纖通道連接的HP BladeSystem的成本比機架式服務器成本低15-2%,服務器數(shù)量超過3-4臺之后,購買刀片服務器就要比傳統(tǒng)機架式服務器更加經(jīng)濟。

  采用上面相同的比較,不帶光纖通道連接的HP BladeSystem(只有內(nèi)部驅動器)的成本比同級別機架安裝基礎設施成本低1-4%,服務器數(shù)量超過6-8臺之后,購買刀片服務器就要比傳統(tǒng)機架式服務器更加經(jīng)濟。

  3.2 降低運營成本

  初始設置時間從每臺服務器12小時降低到30分鐘,實施變更和重新配置的時間從4小時降低到30分鐘,假設每小時的平均管理成本為43美元,若使用HP BladeSystem,每年100臺服務器的成本可從68,800美元降低到8,600美元。

  與采用專用服務器存儲相比,采用網(wǎng)絡存儲可管理多達6倍的存儲,從而將從存儲管理節(jié)省的資源用于戰(zhàn)略創(chuàng)新。

  3.3 更好的性能表現(xiàn)

  采用分布式系統(tǒng)設計和操作系統(tǒng)優(yōu)秀的內(nèi)核應用處理效率獲得顯著提升。CRM部分業(yè)務的性能提高在30%-50%之間。

  現(xiàn)有系統(tǒng)采用集群方式部署、分布式計算,在計算能力提升的同時有效降低單主機負載。采用小型機時,主機忙時平均負載在35%;替換后,單主機忙時平均負載降低到20%。

  3.4 更高可用性

  系統(tǒng)可用性提升

  河南移動CRM系統(tǒng)的刀片服務器安置于多臺機柜中,應用劃分為多個業(yè)務組,同一分組的應用部署于不同機柜的刀片上。通過應用部署避免設備故障導致全系統(tǒng)癱瘓。

  系統(tǒng)提供故障節(jié)點判斷能力,當發(fā)現(xiàn)某進程/設備故障時,系統(tǒng)自動將請求分發(fā)至其他節(jié)點并進行告警,由于采用多服務器集群方式進行負載分擔,降低了單節(jié)點故障對整體系統(tǒng)影響。

  系統(tǒng)提供應用分組負載自適應調(diào)整機制,某分組壓力過大時,可以將服務請求分流至其他低負載分組上。

  設置備用刀片組作為系統(tǒng)設備冗余。備用服務器上應用部署與其他設備相同,處于在線運行狀態(tài),當生產(chǎn)設備故障、應用升級、設備檢修時可以將服務請求接入至備用集群。

  硬件可用性提升

  刀片服務器具備"熱插拔"的能力。某臺刀片設備故障時,僅需將故障刀片拖出機箱,插入新刀片替換即可。

  整合的基礎設施可避免由于各種原因所造成的停機現(xiàn)象,諸如線纜、服務器、存儲、開關故障;人為配置錯誤、以及軟件、電源和散熱問題。解決上述問題的時間大幅度減少,每年計劃內(nèi)和計劃外的停機時間可減少近100%;設備內(nèi)建N+1冗余,因而無需閑置、備用的部件,另外還提供了N+1冗余設計,因此而降低了冗余硬件成本。

  3.5 更高可維護性

  刀片服務器通過集群方式提供高性能的服務,但設備數(shù)量成倍增加給系統(tǒng)的維護、管理帶來一定的難度和工作量的增加?紤]到這一問題,CRM系統(tǒng)提供了自動部署和系統(tǒng)服務追蹤、監(jiān)控功能,保證應用服務器刀片化的同時系統(tǒng)仍具備高可維護性。

  自動應用部署支持自動化、分布式的部署方式,極大簡化應用部署。發(fā)布通過控制設備支持全量、增量可視化發(fā)布,整個發(fā)布過程無須人工干預,僅需要15分鐘;支持針對不同邏輯業(yè)務組定向發(fā)布。通過平臺發(fā)布組件的應用自動發(fā)布功能,系統(tǒng)不因服務器數(shù)量的增加而增加發(fā)布的工作量和差錯率。

  CRM系統(tǒng)實現(xiàn)了追蹤、監(jiān)控功能,可以實現(xiàn)對服務、事物/數(shù)據(jù)庫連接、系統(tǒng)訪問、SQL的多方面監(jiān)控。及時發(fā)現(xiàn)問題和缺陷并進行優(yōu)化調(diào)整。如:服務跟蹤功能可以實時進行營業(yè)員前臺操作、后臺服務調(diào)用、數(shù)據(jù)庫數(shù)據(jù)操作的整個操作軌跡的跟蹤、分析。系統(tǒng)的實時監(jiān)控、服務狀態(tài)跟蹤和故障定位能力使維護人員可以及時發(fā)現(xiàn)薄弱環(huán)節(jié)、準確定位問題從而指導系統(tǒng)優(yōu)化。

  系統(tǒng)使用刀片服務器替換后,數(shù)據(jù)中心設備與管理員的比例大為降低,節(jié)省大量的管理投入。

  3.6 更高可擴展性

  軟件系統(tǒng)由于采用J2EE技術,具備了跨平臺運行能力和極強的擴展能力。系統(tǒng)在不進行任何編碼的情況下,可以實時,在線的進行容量擴展,利用更多的設備,為移動業(yè)務發(fā)展提高更高的保證。

  硬件設備擴容上,刀片服務器可以通過在線/離線增加設備的方式進行擴容和優(yōu)化,即Scale out模式。刀片集群擴展時,僅需要根據(jù)處理能力需求將擴容刀片插入機框即可。系統(tǒng)可以實時、在線的進行容量擴展。

  采用全新的軟件架構與刀片服務器的CRM系統(tǒng)擴容更加靈活性、簡便。計算能力需求實現(xiàn)的顆粒度更加細致。

  3.7 更好的節(jié)能減排效果

  通過CRM應用服務器替換,標準42U機柜占用減少40%,耗電量節(jié)省57%。

  3.8 線纜復雜度降低

  傳統(tǒng)服務器架構的布線增加了巨大的復雜性,是系統(tǒng)停機和不靈活的一個主要根源。

  采用刀片服務器可以減少87%的線纜,平均每個1000M網(wǎng)絡端口可節(jié)約100到350美元。

  通過先進的采用IP的iLO2管理功能,消除了KVM交換機和線纜的需要,每個機架可另外節(jié)省高達25,000美元。

4.創(chuàng)新性分析

  4.1 設備選擇創(chuàng)新

  率先在業(yè)務支撐系統(tǒng)的核心應用系統(tǒng)中采用刀片服務器,與傳統(tǒng)的UNIX服務器相比,刀片服務器的采購成本大大降低,且具備占用空間小、耗電量低、管理和配置簡單靈活等特點,在實際的系統(tǒng)運營過程中同時降低了機房空間、耗電和管理成本。

  4.2 系統(tǒng)架構創(chuàng)新

  傳統(tǒng)的業(yè)務支撐系統(tǒng)應用服務器部署一般采用集群軟件形成主備方式的集群,當主服務器發(fā)生故障時,集群軟件監(jiān)測到故障,自動將系統(tǒng)和應用切換到備份服務器上。河南移動BOSS3.0 CRM系統(tǒng)應用服務器采用統(tǒng)一開發(fā)、運行平臺,所有的應用服務器統(tǒng)一提供對外服務,業(yè)務邏輯分布在多個節(jié)點上處理,單臺節(jié)點發(fā)生故障不影響系統(tǒng)正常服務,從另外一個層面提供了系統(tǒng)可靠性保證。

  此外,系統(tǒng)性能的擴展也可以通過增加服務器節(jié)點的方式實現(xiàn),不需要停止現(xiàn)有的應用服務,簡單靈活。

  4.3 系統(tǒng)運營管理創(chuàng)新

  新系統(tǒng)建成后,整體的系統(tǒng)管理從單一服務器管理轉換為刀片服務器集群管理,利用HP刀片服務器完善的管理工具,新服務器的擴展從傳統(tǒng)的單機安裝、連線、加電、配置、上線,轉換成插板、集群配置和發(fā)布、上線,大大降低了系統(tǒng)升級、配置和管理的工作量。

5.效益分析

  通過新的系統(tǒng)架構和刀片服務器設備的引入,在保障系統(tǒng)可靠性和系統(tǒng)性能擴展性的前提下,降低了業(yè)務支撐系統(tǒng)設備采購成本和系統(tǒng)運營成本。


作者:中國移動通信集團河南有限公司業(yè)務支援中心 趙澤

GreaterChinaCRM (www.gccrm.com)

>