當(dāng)前位置:亞洲制造網(wǎng) > 技術(shù)中心 > 所有分類
UPS冗余供電系統(tǒng)如何正確配置
成都西通機(jī)電工程有限責(zé)任公司 楊貴濛
在UPS供電系統(tǒng)中,模塊化冗余配置是可同時提高系統(tǒng)可用性、可維護(hù)性、可擴(kuò)充性的的措施。但是在實(shí)際應(yīng)用中由于存在著盲目的設(shè)備堆積、忽視可靠性瓶頸、設(shè)備使用不當(dāng)?shù)葐栴},系統(tǒng)的可用性并沒有實(shí)現(xiàn)預(yù)期的目標(biāo),又由于系統(tǒng)的復(fù)雜性增加,不僅增加了一次性投入成本,維護(hù)成本和維護(hù)難度也明顯地增加了。本文將針對與冗余系統(tǒng)配置有關(guān)的錯誤觀念和在實(shí)踐中已發(fā)生過的問題進(jìn)行討論。
一、模塊化冗余系統(tǒng)對提高系統(tǒng)可用性的貢獻(xiàn)
對于UPS供電系統(tǒng),越來越多的廠商和用戶已經(jīng)形成這樣一個共識:UPS系統(tǒng)經(jīng)過多年發(fā)展,在其性能指標(biāo)已滿足計算機(jī)網(wǎng)絡(luò)設(shè)備要求的情況下,真正能為用戶帶來價值的是其可用性。供電系統(tǒng)可用性在概念上包含了設(shè)備的可靠性、可管理性和可維護(hù)性??煽啃愿?、便于管理、故障后可快速修復(fù)等,都意味著給用戶更多的正常使用時間,把故障后不可用時間降到限度。
系統(tǒng)可用性A(t)的定義為:電子系統(tǒng)在使用過程中(尤其在不間斷連續(xù)使用的條件下),可以正常使用的時間與總時間之比。系統(tǒng)可用性可用平均時間MTBF(是設(shè)備失效率λ的倒數(shù))和平均維修時間MTTR表示,即:
(1)
由公式(1)可以看出,要提高系統(tǒng)的可用性,最根本的兩項(xiàng)措施是提高設(shè)備的可靠性和降低系統(tǒng)故障修復(fù)時間。
要提高設(shè)備的可靠性,通常的做法是:采用的主電路結(jié)構(gòu)和控制技術(shù),對整機(jī)做專門的可靠性設(shè)計,包括控制電路的可靠性設(shè)計、功率電路和功率器件的可靠性設(shè)計、提高功率器件的規(guī)格和檔次并降容使用、熱可靠性設(shè)計、耐環(huán)境可靠性設(shè)計、電磁兼容可靠性設(shè)計、安全性可靠性設(shè)計、嚴(yán)格生產(chǎn)工藝、加強(qiáng)質(zhì)量管理等。但是,組成UPS主機(jī)的上千個元器件和幾千個接點(diǎn),在可靠性模型圖上是串連的,整個系統(tǒng)的可用性是這些器件和接點(diǎn)可靠性的乘積,所以以上措施對提高設(shè)備的可靠性雖然是有效的,但效果是有限的。
鑒于以上情況,UPS廠商開始在UPS系統(tǒng)配置方案上探討提高系統(tǒng)可用性的途徑,雖然UPS產(chǎn)品本身的可靠性設(shè)計是提高可用性的關(guān)鍵,但是合理的UPS系統(tǒng)配置和使用方法也可大大提高整個UPS供電系統(tǒng)的可用性。所以系統(tǒng)配置方案也是UPS可用性設(shè)計的一個重要內(nèi)容。在這方面的技術(shù)突破是UPS的模塊化冗余并機(jī)技術(shù)。如圖1所示。
這里要說明的是,模塊化冗余系統(tǒng)的定義應(yīng)該是:系統(tǒng)中,一個設(shè)備整機(jī)或者一個完整的功能模塊可以在不影響系統(tǒng)正常運(yùn)行的情況下維護(hù)或更換,則這個系統(tǒng)就叫模塊化冗余系統(tǒng)。
UPS冗余并機(jī)應(yīng)具備的條件是:輸出可直接并聯(lián),在系統(tǒng)容量備份情況下可脫機(jī)維護(hù)。
UPS整機(jī)在具備了以上條件時,就可組成圖1所示的模塊化冗余并機(jī)系統(tǒng),整機(jī)本身在系統(tǒng)中就是一個模塊,但是故障后脫機(jī)維護(hù)的時間(MTTR)可能很長,甚至還包括廠商對故障反映的時間和備件儲備發(fā)運(yùn)的時間。
把一臺整機(jī)按功能分割成幾個完整的模塊,然后組成一個完整的UPS整機(jī)系統(tǒng),這就是當(dāng)前已被用戶認(rèn)可并廣泛應(yīng)用的“模塊化UPS”,與整機(jī)并機(jī)系統(tǒng)相比,它的的優(yōu)點(diǎn)是可用插拔的方法把故障脫機(jī)維護(hù)時間(MTTR)縮到最短,在用戶現(xiàn)場有備件的情況下,可將此時間縮短到1小時。
僅就UPS冗余并機(jī)環(huán)節(jié),用圖1的可靠性模型就可看出模塊化冗余系統(tǒng)對提高系統(tǒng)可用性的貢獻(xiàn)。
圖1(a)兩臺都故障時則系統(tǒng)故障,
可用性模型如圖2所示
A1、A2分別是UPS1 和UPS2的可用性,
則系統(tǒng)的可用性:
當(dāng)A2=A1時
(2)
圖1(b)在滿負(fù)荷時任意兩個模塊發(fā)生故障,則系統(tǒng)故障,可用性模型如圖3所示
由圖3可以看出,4+1冗余并機(jī)系統(tǒng)相當(dāng)于10個1+1冗余并機(jī)系統(tǒng)的串聯(lián),如果每個UPS的可用性都相同并都等于A1時,系統(tǒng)的可用性為:
(3)
假定UPS單機(jī)(或模塊)的MTBF=10萬小時,平均維護(hù)時間MTTR=8小時,而模塊化可插拔的平均維護(hù)時間MTTR=1小時,則對系統(tǒng)可用性計算結(jié)果如下表數(shù)據(jù)
可用性A(t) | |||
99%負(fù)載 | 75%負(fù)載 | 50%負(fù)載 | |
單機(jī)MTTR=8h,MTBF=10萬h | 0.9999 | 0.9999 | 0.9999 |
單機(jī)1+1,MTTR=8h,MTBF=10萬h | 0. | 0. | 0. |
單機(jī),4+1,MTTR=8h, MTBF=10萬h | 0. | ≈1 | ≈1 |
模塊化,4+1,MTTR=1h, MTBF=10萬h | 0.999999995 | ≈1 | ≈1 |
值得注意的是,單機(jī)和單機(jī)1+1冗余的可用性都與負(fù)載量無關(guān),而單機(jī)4+1冗余的可用性則與負(fù)載量有關(guān),75%負(fù)載時系統(tǒng)變成3+2,50%負(fù)載時系統(tǒng)變成2+3,所以可
用性隨負(fù)載量減小而變高??刹灏文K系統(tǒng)的可用性除了與負(fù)載量有關(guān)外,還因?yàn)楣?/SPAN>
障修復(fù)時間可降到1小時,所以系統(tǒng)可用性更高。
圖4是不可用性(1-A)與MTBF和MTTR 的關(guān)系的計算曲線,更明顯地顯示了MTTR和MTBF對可用性的影響。
二、市電冗余和UPS雙輸入問題
在新建和改建的計算機(jī)供電系統(tǒng)中,大都不同程度地采用了UPS模塊化冗余并機(jī)方案,但是在已投入運(yùn)行的系統(tǒng)中,卻存在著一些需要討論的觀念和問題。雙市電冗余輸入(或市電加油機(jī))與UPS雙輸入的方案就值得討論。如圖5所示。
圖5(a)中,UPS是雙轉(zhuǎn)換電路結(jié)構(gòu),主電路和靜態(tài)旁路可以分開輸入,市電2為主電路供電,市電1為靜態(tài)旁路供電。主電路逆變器工作頻率跟蹤旁路市電。此系統(tǒng)在結(jié)構(gòu)上是可行的,但從冗余功能來看,卻明顯地存在著以下幾個問題:
(1)、如圖5(b)所示,當(dāng)市電1故障掉電時,UPS主電路繼續(xù)工作,但系統(tǒng)失去了轉(zhuǎn)旁路的功能。要知道,可靠性MTBF是在UPS在帶轉(zhuǎn)旁路功能的情況下得出的,UPS主電路與靜態(tài)旁路是冗余配置,失去轉(zhuǎn)旁路功能會大大降低UPS系統(tǒng)的可靠性,典型的數(shù)據(jù)是,如果帶轉(zhuǎn)旁路功能的UPS的MTBF值為15萬小時,不帶轉(zhuǎn)旁路功能時僅有3萬小時;
(2)、如圖5(c)所示,當(dāng)市電2故障掉電時,UPS主電路會轉(zhuǎn)電池逆變工作,在系統(tǒng)有雙路市電輸入的情況下,電池的備用時間通常都在10-30分鐘范圍內(nèi),如果電池放電結(jié)束而市電2仍未恢復(fù),則UPS就轉(zhuǎn)旁路由市電1供電。其結(jié)果一是負(fù)載直接由質(zhì)量不高的市電供電,二是UPS因電池放電終結(jié)而失去不停電供電功能。在整個過程中UPS只相當(dāng)一個可延時不間斷轉(zhuǎn)換的靜態(tài)轉(zhuǎn)換開關(guān)STS。
總之,兩路市電本來是冗余的,但任何一路掉電都會使系統(tǒng)工作不正常,甚至使UPS系統(tǒng)失去不停電供電功能。
要解決以上問題,正確的配置應(yīng)該是在兩路市電后先加入自動轉(zhuǎn)換開關(guān)ATS,如圖5(d)所示。這樣才能在不對UPS系統(tǒng)產(chǎn)生任何影響的情況下實(shí)現(xiàn)雙路市電冗余。
圖6是用UPS雙輸入實(shí)現(xiàn)市電冗余的典型錯誤案例。
此系統(tǒng)設(shè)計的主要依據(jù)和設(shè)計思路是這樣的:
系統(tǒng)要求:四路負(fù)載由獨(dú)立的四路主供電UPS1- UPS4供電;輸入由雙市電通過ATS1冗余,然后再與油機(jī)通過ATS2冗余;
設(shè)計思路:雙路市電通過ATS1冗余后直接向四路主供UPS的主電路供電;油機(jī)與冗余的市電再通過ATS2冗余向四路主供UPS的靜態(tài)旁路供電;
為了解決UPS轉(zhuǎn)旁路后的質(zhì)量問題,在ATS2后再加一臺與四路主供UPS同容量的UPS5,設(shè)計認(rèn)為此設(shè)計方案的巧妙之處就在于只用了5臺UPS就實(shí)現(xiàn)了四路獨(dú)立運(yùn)行的UPS的冗余問題。
圖6設(shè)計通過了方案評審并進(jìn)入采購招標(biāo)階段,但存在的問題是嚴(yán)重地并且是顯而易見的:
(1)此方案采用了串聯(lián)熱備份方案,如圖7所示,與均流直接并機(jī)相比,其不利因素有UPS工作壽命低(一臺連續(xù)滿負(fù)荷工作)、電池利用率低、對UPS輸出負(fù)載階躍性能要求高等,因而已不大采用了;
(2)由于UPS5與其它四路主供UPS規(guī)格容量相同,所以只允許一路主供UPS轉(zhuǎn)旁路,此時其它三路失去轉(zhuǎn)旁路功能,系統(tǒng)可靠性降低,有兩臺UPS需要同時轉(zhuǎn)旁路時,則這兩路UPS直接宕機(jī);
(3)如果UPS5 故障,則使四路主供UPS都失去轉(zhuǎn)旁路的功能,如果UPS5 轉(zhuǎn)旁路工作,則不再保證四路主供電UPS轉(zhuǎn)旁路時的供電質(zhì)量;
(4) 當(dāng)兩路市電同時故障掉電時,四臺主供電UPS都進(jìn)入電池逆變狀態(tài),待電池能
量放到下,盡管油機(jī)已經(jīng)啟動正常,但是由于備用UPS5的容量有限,所以四臺主供UPS都宕機(jī),停止對負(fù)載供電,柴油發(fā)電機(jī)等于虛設(shè),是UPS5阻斷了它的能量的輸出。
三、雙總線UPS系統(tǒng)的可靠性模型
可用性級別的雙總線系統(tǒng)
為了提高供電系統(tǒng)的可用性,大多數(shù)新建的數(shù)據(jù)中心(IDC)都采用了雙總線UPS供電系統(tǒng),如圖8所示。圖8的上部分是當(dāng)前比較常用的雙總線配置方法,當(dāng)然也還可以做些有益的改動,特別是交流輸入部分的ATS和輸出部分的STS,增加設(shè)備和改變配置方法還可以進(jìn)一部提高系統(tǒng)的可用性,這里不做專門地討論。本文要討論的是UPS環(huán)節(jié)的可用性問題。人們常常簡單地認(rèn)為只要是雙總線就會勿容置疑地實(shí)現(xiàn)總線冗余功能,投入運(yùn)行后才發(fā)現(xiàn)他們的系統(tǒng)根本就達(dá)不到設(shè)計預(yù)期的效果。僅就UPS環(huán)節(jié)而言,問題就發(fā)生在兩路UPS并沒有隔離,圖8的下部分是UPS環(huán)節(jié)的可用性模型圖。圖中,A1是輸入輸出配電1-4的可用性,AU是UPS1和UPS2的可用性。由于UPS1和UPS2并不隔離,所以在模型圖中又出現(xiàn)了AU2.1、AU1.2、A3三個可用性參數(shù):
A3:總線同步器的可用性。由于輸出端配置是的靜態(tài)轉(zhuǎn)換開關(guān)STS,總線同步器可使兩路UPS輸出電壓同頻同相,為STS的安全轉(zhuǎn)換提供必要的條件。因?yàn)榭偩€同步器的工作狀態(tài)同時與雙總線的兩路UPS有關(guān),所以在可用性模型圖中是單路經(jīng)故障點(diǎn)。正因?yàn)閮陕?SPAN lang=EN-US>UPS不能隔離,根據(jù)可靠性科學(xué)的相依性理論,于是就在UPS環(huán)節(jié)中還存在下面兩個可用性參數(shù):
AU2.1:由于UPS2故障而引起的UPS1故障的等效可用性參數(shù);
AU1.2:由于UPS1故障而引起的UPS2故障的等效可用性參數(shù);
盡管 AU2.1、AU1.2還沒有可量化的參考數(shù)據(jù),但在系統(tǒng)實(shí)際運(yùn)行中,由于一臺UPS故障而誘發(fā)另一臺同時故障的現(xiàn)象卻是屢見不鮮的。系統(tǒng)恢復(fù)后又發(fā)現(xiàn)被誘發(fā)故障的一臺又是一切正常的,甚至找不出故障的原因。
采用圖9 配置可使雙總線系統(tǒng)的可用性達(dá)到別。此方案設(shè)計的要點(diǎn)是:
(1)由于當(dāng)前的IT負(fù)載設(shè)備絕大部分是實(shí)現(xiàn)了雙電源供電,所以可用雙路電源直接輸入,而無需再加轉(zhuǎn)換開關(guān)STS;
(2)對于少數(shù)的單電源負(fù)載,可用小功率(≤3KVA)的ATS(或無需輸入同步的小STS),由于不需要兩路輸入同步,所以就可去掉雙總線中的總線同步器。小ATS的轉(zhuǎn)換時間可做到<10ms,絲毫不影響負(fù)載的正常運(yùn)行;
(3)市電(冗余)輸入后,與油機(jī)用兩個ATS實(shí)現(xiàn)冗余。
從圖11可以看出,對于少數(shù)單電源負(fù)載,只有一個單路經(jīng)故障點(diǎn)ATS,而對于大
多數(shù)雙電源負(fù)載,則實(shí)現(xiàn)了兩路供電的隔離。如果每路的可用性為4個9,那末雙總線的可用性就是8個9,因此我們可認(rèn)為是可用性級別的雙總線系統(tǒng)。
四、結(jié)束語
在系統(tǒng)設(shè)計和實(shí)際配置中還存在著其他各種問題,在不同程度上影響了冗余系統(tǒng)可用性功能的正常發(fā)揮。
寬輸入電壓范圍的UPS在電網(wǎng)電壓變化大于±10%的地方,因拒絕轉(zhuǎn)旁路而會失去主電路與靜態(tài)旁路的冗余功能;在直接并機(jī)配置中,公用電池組會增加一個單路經(jīng)故障點(diǎn);并機(jī)超過4臺時,在系統(tǒng)轉(zhuǎn)旁路時,各臺旁路不能保證均流效果,所以應(yīng)加系統(tǒng)集中旁路;旁路帶隔離變壓器的UPS不宜直接并機(jī),因?yàn)橄到y(tǒng)轉(zhuǎn)旁路時,變壓器會因直接并聯(lián)運(yùn)行而損壞等。
總之,要從整個系統(tǒng)的角度去分析并精心設(shè)計冗余系統(tǒng),要正確配置和使用每個環(huán)節(jié)的設(shè)備,特別是要防止簡單地設(shè)備堆積,在不過份增大成本的前提下設(shè)計建造出性能優(yōu)良的冗余系統(tǒng)。