Chris Loeffler
云計算正在引起廣泛的討論并為企業(yè)IT世界帶來了活力。由于渴望提高效率和降低成本,各種規(guī)模和各式各樣的組織都在迅速地采用基于Web的軟件、平臺和基礎設施解決方案。確實,分析公司國際數(shù)據(jù)公司(International Data Corporation)預計在2009年到2013年間,企業(yè)在云服務方面支出的復合年均增長率將達到26%,即從174億美元增長到442億美元。專家們預測也就是幾年的時間,大多數(shù)企業(yè)都會至少使用一些基于云技術的應用和服務。
然而,除了能夠簡化管理、提高靈活性之外,云計算也對供電、冷卻和可用性帶來了挑戰(zhàn)。為了應對這些挑戰(zhàn),各企業(yè)必須增加其電氣及機械基礎設施的強度和彈性。
本調查不斷采用基于云的解決方案背后的推動力,研究云架構如何影響數(shù)據(jù)中心,討論一系列能夠幫助公司在不損失正常運行時間或過載其供電與冷卻系統(tǒng)的情況下受益于云計算的具體方法與技術。
盡管存在各種各樣的定義,云計算最基本的定義就是IT基礎架構、服務和軟件通過互聯(lián)網或內部基于Web的基礎架構進行實時交付。一般來說,云解決方案分為三大類:
軟件即服務(SaaS),這種解決方案通過云來交付軟件應用。例如,在線CRM應用Sales和基于Web的生產力套裝軟件Google Apps,都是常見的SaaS服務。
平臺即服務(PaaS),這類解決方案提供在線訪問計算資源和編程工具,開發(fā)人員可以利用這些資源和編程工具來創(chuàng)建和控制基于云計算的應用。如:源于Sales的Force.com,還有Microsoft Windows Azure,就是兩個人們比較熟悉的PaaS解決方案。
基礎設施即服務(IaaS),這類解決方案通過Web提供像存儲空間和處理能力這樣的基礎設施資源。亞馬遜網絡服務(Amazon Web Services)就是最的IaaS提供商之一。
無論是哪一類云計算解決方案,它們都能通過“公共云”(public cloud)或“私有云”(private cloud)來交付。公共云解決方案通過互聯(lián)網交換數(shù)據(jù)。在用戶端,除了一個Web瀏覽器和高速互聯(lián)網連接外,它們不需要任何基礎設施,其典型的收費方式為訂閱型現(xiàn)收現(xiàn)付制(subscription-based),您只需為所使用的資源付費。私有云解決方案利用相同的基礎技術和協(xié)議作為其公共對等物,但駐留在企業(yè)防火墻內的私有或租用的服務器上。許多IT經理人們都相信,私有云方案使他們的安全和管理工作更加輕松。
無論是公共云還是私有云解決方案,都能夠帶來大量的商業(yè)和技術方面的效益:
效率:云解決方案通常運行在靈活、高度自動化的基礎架構上,它們在管理上更加簡單,因而成本更低。另外,由于它們不需要本地服務器資源,公共云解決方案使各企業(yè)避免了巨大的前期軟硬件投資,使IT由資本支出轉為費用。
靈活性:大多數(shù)云基礎架構都廣泛采用服務器虛擬化技術,這種技術允許單個物理服務器宿主成多個“虛擬服務器”,而每個虛擬服務器都有其自己的操作系統(tǒng)和應用程序。由于那些虛擬服務器本質上只是些復雜的計算機文件,創(chuàng)建一個虛擬服務器所需的時間只相當于建立一個新的物理服務器的一小部分。因此,云環(huán)境使企業(yè)部署新的應用和服務的速度遠遠高于傳統(tǒng)環(huán)境。
可擴展性:大多數(shù)云方案都利用虛擬化帶來的靈活性,使用戶根據(jù)需求的變化而動態(tài)地增加或去除處理與儲存能力。
云計算如何影響IT基礎設施
維持可用性和提供充足的供電和制冷能力對于傳統(tǒng)的數(shù)據(jù)中心管理人員來說是長期存在的挑戰(zhàn)。然而,由于種種原因,云數(shù)據(jù)中心的管理人員要解決那些問題會更加困難。
供電與制冷
大多數(shù)云基礎架構用于宿主虛擬機的服務器硬件都比典型的單一功能的服務器更大且更穩(wěn)定。同時也得到更為廣泛的利用:當平均非虛擬服務器以 5~15%的處理能力運行時,平均虛擬主服務器在任何時候的利用率可能高達80%。鑒于這兩種原因,大多數(shù)云數(shù)據(jù)中心的虛擬主服務器都比傳統(tǒng)服務器需要更多的供電,配電裝置(PDU)、配電盤和不間斷電源系統(tǒng)(UPS電源)的負擔也更重。
可靠性
大多數(shù)云計算環(huán)境大量采用虛擬化技術對可用性具有重要影響。在傳統(tǒng)的數(shù)據(jù)中心,每個服務器通常只支持一種應用。而在虛擬化的云計算數(shù)據(jù)中心,一個主服務器可以支持幾種或多種應用。因此,一旦主機發(fā)生故障,將會影響大批用戶和企業(yè)職能。
此外,令云計算和虛擬化如此吸引人的靈活性也能夠在有意無意間導致停機。沒有正確的管理,在數(shù)據(jù)中心內或跨數(shù)據(jù)中心的突然轉移工作負荷會造成電路過載或冷卻系統(tǒng)負擔過重,進而使關鍵的系統(tǒng)崩潰。
基于云基礎架構的供電與冷卻策略
I T及設備管理人員可以通過實施下述策略來應對為云環(huán)境提供供電和冷卻的巨大挑戰(zhàn)。
采用模塊式供電與冷卻系統(tǒng)組件
任何云數(shù)據(jù)中心的管理者都不希望其供電和冷卻能力無法滿足客戶需求。另一方面,在未來需要之前過早地提前部署額外能力會浪費大量的時間、金錢和資源。
UPS電源供電模塊的規(guī)模小到3kVA,大到1,000kVA以上。一般來說,企業(yè)應該部署比成品模塊預計滿容量小4~6倍的UPS電源模塊。
圖2:模塊式電源組件讓您根據(jù)需求的不斷增長而遞增式地提高能力。
現(xiàn)在,大多數(shù)企業(yè)都在其服務器所在樓層的周圍部署機房空調(CRAC)裝置來解決數(shù)據(jù)中心產生的熱量。許多公司還采用“熱通道-冷通道”式硬件配置,針對的服務器機柜只配置了熱風排出或者冷風吸入。這就產生了對流循環(huán),從而形成冷卻的連續(xù)氣流。然而,雖然這類技術基本足以應對傳統(tǒng)數(shù)據(jù)中心的需求,但卻往往無法處理云基礎架構產生的巨大熱量。因此,公共和私有云環(huán)境通常需要更、更強大的冷卻技術。
模塊式冷卻系統(tǒng)組件與上面討論過的UPS電源設計類似,目前許多制造商都有生產。然而,根據(jù)需求的增長部署額外的冷卻模塊并不像模塊式UPS電源那么簡單。數(shù)據(jù)中心管理人員通常必須提前為那些設備安裝造價昂貴的地板下或架空管道。因此,許多公司寧愿通過配備帶有變頻驅動或電子整流(EC)扇的CRAC和機房空氣調節(jié)器(CRAH)系統(tǒng)來降低與冷卻相關的耗電量。變頻驅動讓空氣調節(jié)系統(tǒng)在服務器需要較少的冷卻量時運行得更慢,在工作負荷達到峰值時運行得更快,從而達到節(jié)能目的。同樣,EC風扇采用“智能”電機,根據(jù)氣流的需求量運行得更快或更慢。
圖3:在最初施工時可以加裝帶快速接頭的地板下或架空管道,盡管它們會增加施工成本。
圖4:本文所述的被動式冷卻系統(tǒng)利用氣密的機殼和煙囪在熱風與冷風混合前排出數(shù)據(jù)中心,從而使溫度管理更加高效。
提供公共云服務的大型數(shù)據(jù)中心通常在與服務器樓層相鄰的設備間內配備UPS電源設備。建立兩個設備間,一個用于UPS電源和供電系統(tǒng)電氣組件,另一個用于UPS蓄電池,這種安排的效率更高。由于UPS電源電子裝置的典型安全工作溫度為35°C / 95°F,UPS蓄電池溫度通常必須保持在25°C / 77°F。
盡管云計算使得保持正常運行時間更加困難,下面所討論的方法和技術能夠顯著改善這項任務。
進行電源鏈審計
打算在現(xiàn)有數(shù)據(jù)中心的基礎上增加云基礎架構的企業(yè)應該在其部署前規(guī)劃中包含電源鏈審計。由通過認證的供電系統(tǒng)工程師進行審計時,電源鏈審計有助于評估您的供電系統(tǒng)和確定哪個需要進行升級、擴展或現(xiàn)代化(如果有),以支持云環(huán)境更苛刻的要求。另外,電源鏈審計還能夠幫助您識別潛在的成本節(jié)約機會,評估您的供電組件的電氣安全性。
為供電基礎架構增加冗余度
企業(yè)可以利用如下的冗余供電系統(tǒng)架構來提高可用性和減少計劃外停機的可能性:
N+1:N+1架構比保持服務器設備啟動和運行所需的要求多一個UPS、發(fā)電機或其它供電組件。因此,如果任何一個組件發(fā)生中斷或需要維護,其余系統(tǒng)仍能提供充分的保護,以免數(shù)據(jù)丟失。N+1架構一般足以滿足小型或中型云環(huán)境的需求。
圖5:即使UPS因技術問題或維護要求而關閉,N+1供電體系結構仍能繼續(xù)工作。
2(N)架構與含有雙電源的服務器配合使用。在這種排列中,每個電源一般都是利用一個獨立的供電路徑。那樣,即使整個動力總成都關機進行維修或維護,服務器仍然可用。
圖6:A 2(N)電源架構利用獨立且相同的供電路徑。如果任何一個路徑發(fā)生故障,另一個會自動補償。
為了進一步提高可靠性,云數(shù)據(jù)中心管理人員可以使用基于軟件的冗余技術,如:復制。復制解決方案持續(xù)捕獲所保護的服務器上發(fā)生的變化,然后接近實時地將其復制到備份服務器中。如果主服務器發(fā)生故障,則備份服務器能夠迅速介入,從而確保無縫的可用性。
利用實時遷移軟件
利用許多服務器虛擬化解決方案中內建的實時遷移功能是另一個有效的基于軟件的可靠性策略。實時遷移系統(tǒng),如:VMware公司的在線遷移(vMotion)解決方案,讓管理員能夠幾乎同時地將虛擬服務器由一個物理主機遷移至另一個物理主機,以解決技術問題或滿足維護要求。假如一個物理服務器有即將發(fā)生故障的跡象,技術人員就可以利用實時遷移軟件迅速地將其虛擬機轉移至另一個宿主機上,直到問題解決為止。
部署集成管理軟件
清潔、可靠的電源是云基礎架構作為處理能力和存儲空間成功運行的關鍵。那么,為了讓云數(shù)據(jù)中心保持平穩(wěn)運行,管理員需要關于其IT資源和電力資源的完整的信息。現(xiàn)在,許多云操作人員都利用獨立的管理工具來監(jiān)測其服務器和電源環(huán)境。然而,現(xiàn)在有了集成的解決方案,它讓管理員能夠只通過一個控制臺就能管理物理服務器、虛擬服務器、UPS、PDU等。