您企業(yè)的數(shù)據(jù)中心應(yīng)該有一套成功的基礎(chǔ)設(shè)施容量能力方案,以便能夠支持所有的日常運(yùn)營(yíng)。
在本文中,相關(guān)的業(yè)界專家將為我們廣大讀者諸君分析導(dǎo)致您企業(yè)數(shù)據(jù)中心高密度的原因,以及如何就您企業(yè)數(shù)據(jù)中心的重要工作負(fù)載所需要的空間、電力和冷卻等進(jìn)行有效的溝通。此外,文章還將為您推薦關(guān)于基礎(chǔ)設(shè)施容量能力分析問(wèn)題的四條指南,以幫助開(kāi)發(fā)一套切實(shí)的、能夠滿足您企業(yè)未來(lái)需求的數(shù)據(jù)中心戰(zhàn)略。
如何定義數(shù)據(jù)中心的規(guī)模大小、密度?
有大量的指標(biāo)來(lái)衡量數(shù)據(jù)中心的占地面積、電力和冷卻需求。而數(shù)據(jù)中心管理者協(xié)會(huì)AFCOM則認(rèn)為現(xiàn)在是時(shí)候削減這些方面的需求了。
您會(huì)不停的聽(tīng)到有業(yè)內(nèi)相關(guān)從業(yè)人員抱怨表示說(shuō) 我們的數(shù)據(jù)中心非常密集 或’我們的數(shù)據(jù)中心規(guī)模太小’,但這其實(shí)并不真正意味著什么,或者他們的抱怨會(huì)涉及到任何具體的數(shù)據(jù)。 AFCOM的總裁湯姆 羅伯茨說(shuō)。
該協(xié)會(huì)的數(shù)據(jù)中心研究所智囊團(tuán)與數(shù)據(jù)中心的設(shè)計(jì)師、運(yùn)營(yíng)商和供應(yīng)商們合作,對(duì)數(shù)據(jù)中心的規(guī)模大小和密度等相關(guān)術(shù)語(yǔ)條款進(jìn)行了資格認(rèn)證,提出了相應(yīng)的數(shù)據(jù)中心標(biāo)準(zhǔn)。如下,是對(duì)其數(shù)據(jù)中心標(biāo)準(zhǔn)介紹文章的相關(guān)摘錄。
AFCOM通過(guò)空間計(jì)算來(lái)描述數(shù)據(jù)中心的規(guī)模大小,并通過(guò)測(cè)量峰值千瓦(kW)負(fù)載來(lái)描述數(shù)據(jù)中心的密度。
達(dá)到極致
AFCOM將數(shù)據(jù)中心密度細(xì)分為四類:低密度(達(dá)到每機(jī)架4千瓦)、中密度(5千瓦到8千瓦)、高密度(8千瓦到15千瓦)和極端密度(平均每臺(tái)機(jī)架超過(guò)16千瓦)。
對(duì)于數(shù)據(jù)中心密度的關(guān)注是非常及時(shí)的。較之五年前,今天的托管合同會(huì)更多的涉及到電力的問(wèn)題,而彼時(shí)的合同談判內(nèi)容還大多聚焦在數(shù)據(jù)中心占地空間方面,美國(guó)的一家托管空間提供商Infomart Data Centers的總裁 John Sheputis表示說(shuō)。
服務(wù)器整合 隨著虛擬化和處理器的不斷發(fā)展演化,數(shù)據(jù)中心每平方英尺的密度也在不斷增加。所需管理的機(jī)柜和電源供應(yīng)設(shè)備越來(lái)越少,保持日常運(yùn)維的各種線纜也在減少 從一個(gè)IT運(yùn)營(yíng)的角度來(lái)看,所有這一切都是相當(dāng)美好的。但這些趨勢(shì)卻改變了對(duì)于高密度和低密度的理解,Sheputis表示說(shuō)。
Cosentry公司是一家總部設(shè)在內(nèi)布拉斯加州奧馬哈的一家托管服務(wù)提供商,該公司通過(guò)跟蹤其基礎(chǔ)設(shè)施每臺(tái)機(jī)柜的平均功耗來(lái)為服務(wù)器空間的設(shè)計(jì)設(shè)置基準(zhǔn)。 十年前,每臺(tái)機(jī)柜的平均功耗大概是700?800瓦。 Cosentry公司數(shù)據(jù)中心服務(wù)副總裁Jason Black表示說(shuō)。 五年前,平均功耗大概是1.5千瓦。而現(xiàn)在則達(dá)到了3千瓦。按照目前的趨勢(shì)發(fā)展下去,我們預(yù)計(jì)在未來(lái)五年內(nèi),將看到平均功耗達(dá)到5或6千瓦。
當(dāng)Infomart數(shù)據(jù)中心將其達(dá)拉斯的操作運(yùn)營(yíng)與俄勒岡州希爾斯伯勒和圣何塞的Fortune數(shù)據(jù)中心合并,并收購(gòu)Ashburn獲得了前美國(guó)在線公司位于維吉尼亞州Ashburn的數(shù)據(jù)中心時(shí),親身經(jīng)歷了這種體驗(yàn)。
較之新的數(shù)據(jù)中心,舊數(shù)據(jù)中心的能量密度要低兩到三倍。 Sheputis表示,并補(bǔ)充說(shuō)在很短的時(shí)間內(nèi),能量密度的標(biāo)準(zhǔn)變化很大。
對(duì)比舊的Ashburn設(shè)施與達(dá)拉斯州的先進(jìn)設(shè)施,這種密度的差異是相當(dāng)明顯的。在其于2015年再次投產(chǎn)運(yùn)營(yíng)前,Ashburn數(shù)據(jù)中心重新進(jìn)行了改造,不僅僅只是針對(duì)數(shù)據(jù)中心運(yùn)營(yíng)操作空間的改造,同時(shí)還包括高密度的操作。
AFCOM計(jì)劃匯總類似的跟蹤基線,并通過(guò)規(guī)范化數(shù)據(jù)中心規(guī)模和密度的術(shù)語(yǔ)進(jìn)行大量的數(shù)據(jù)比較。
關(guān)于數(shù)據(jù)中心密度的細(xì)節(jié)問(wèn)題
雖然AFCOM對(duì)于數(shù)據(jù)中心的總密度進(jìn)行了類別分類,但在空間規(guī)劃過(guò)程中仍然存在一些細(xì)節(jié)問(wèn)題。
以前,同樣平方英尺的空間占地面積僅僅只承載2千瓦的混合機(jī)柜,現(xiàn)在則承載著一排8千瓦的服務(wù)器、每臺(tái)消耗4千瓦的一組存儲(chǔ)陣列、以及低功率網(wǎng)絡(luò)和外設(shè)機(jī)柜。在數(shù)據(jù)中心中的一個(gè)部分處理大數(shù)據(jù)的超級(jí)計(jì)算島(supercomputing island)每臺(tái)機(jī)架為15千瓦,而其他的每臺(tái)機(jī)架僅使用3千瓦或每4千瓦。設(shè)施規(guī)劃不僅僅只是匯總電源和冷卻需求,同時(shí),對(duì)于空間占地面積的討論仍然是相當(dāng)有用的,Black表示說(shuō)。但最重要的則是:在一處既定的占地空間,到底有多少可用的機(jī)架占地空間。因此,AFCOM對(duì)數(shù)據(jù)中心的規(guī)模大小進(jìn)行了分類,從迷您型(可容納多達(dá)10臺(tái)機(jī)架)到兆級(jí)(空間超過(guò)9000臺(tái)機(jī)架),結(jié)合了密度測(cè)量,以生成數(shù)據(jù)中心功率需求信息。 每平方英尺的瓦數(shù)對(duì)于當(dāng)今的工作負(fù)載是一項(xiàng)重要的標(biāo)準(zhǔn)。 Cosentry公司的Black說(shuō)。
由此,近年來(lái)所發(fā)展出的:機(jī)柜定位單元(Rack location unit)這一概念術(shù)語(yǔ),便是為了幫助估計(jì)在一個(gè)給定的占地面積的利用率,或估算容量能力。前考慮到了機(jī)柜的占地面積和冷熱通道。但并不是每一家IT企業(yè)組織均可以通過(guò)這個(gè)指標(biāo)來(lái)討論他們的數(shù)據(jù)中心的需求。
在許多情況下,數(shù)據(jù)中心物理空間的管理已經(jīng)拋給了具備專業(yè)知識(shí)的其他領(lǐng)域的IT人員,如存儲(chǔ)和網(wǎng)絡(luò)專業(yè)人士。 Black說(shuō)。 大多數(shù)人都只是在數(shù)據(jù)中心進(jìn)行部分的優(yōu)化,并不知道整體性的最佳實(shí)踐做法。
在一處企業(yè)內(nèi)部部署的數(shù)據(jù)中心,圍繞功率和密度獲得清晰的掌握也許沒(méi)有什么大問(wèn)題。畢竟,每月電費(fèi)賬單由設(shè)施的預(yù)算產(chǎn)生,只要持續(xù)對(duì)數(shù)據(jù)中心操作運(yùn)營(yíng)空間里最熱的機(jī)柜實(shí)施冷卻,您具體使用何種術(shù)語(yǔ)并不重要。但到了今天,企業(yè)內(nèi)部部署的數(shù)據(jù)中心的設(shè)施大都面臨著使用壽命的結(jié)束或需要進(jìn)行重大的更新升級(jí),電力使用效率來(lái)自于政府行政部門的審查,故而使得許多企業(yè)組織計(jì)劃遷移到一處托管設(shè)施。突然間,企業(yè)組織的IT領(lǐng)導(dǎo)者們需要掌握如何就重要工作負(fù)載所需要的數(shù)據(jù)中心的占地空間、電力和冷卻進(jìn)行有效的溝通。
AFCOM的意圖是能夠讓數(shù)據(jù)中心的經(jīng)理們能夠測(cè)量計(jì)算空間、設(shè)計(jì)密度和電流的功率,并清楚其數(shù)據(jù)中心的運(yùn)行情況。例如,一處設(shè)計(jì)為低密度的小型數(shù)據(jù)中心,目前以52%機(jī)架產(chǎn)量在中等密度運(yùn)行。
借助基礎(chǔ)設(shè)施容量規(guī)劃避免增長(zhǎng)過(guò)程中的煩惱
預(yù)測(cè)未來(lái)的數(shù)據(jù)中心空間,電源和冷卻要求是一個(gè)不可能完成的任務(wù),但卻必須做到。這從來(lái)都不容易,而隨著云計(jì)算的出現(xiàn),使得基礎(chǔ)設(shè)施的容量規(guī)劃變得更為困難。
建設(shè)、整治、更新、升級(jí)或擴(kuò)大數(shù)據(jù)中心不僅成本昂貴,而且是具有破壞性和潛在的危險(xiǎn)的。
數(shù)據(jù)中心占地空間始終是很難獲得的,所以您企業(yè)肯定不會(huì)想要超出您所能證明真實(shí)需求的占地空間。這也同樣適用于電源和冷卻:相關(guān)的機(jī)電設(shè)備需要占地空間 有時(shí)甚至與計(jì)算領(lǐng)域一樣多或更多 并且,對(duì)這一部分實(shí)施擴(kuò)展的成本最昂貴。聲稱您需要比您以往任何時(shí)候所使用的瓦特?cái)?shù)量都多可能是沒(méi)有考慮到一個(gè)數(shù)據(jù)中心項(xiàng)目的價(jià)格因素,并或?qū)?dǎo)致失敗的節(jié)約措施。而不準(zhǔn)確的容量估計(jì)最壞的結(jié)果可能充其量是相關(guān)人員職業(yè)生涯的結(jié)束,而最好的結(jié)果也會(huì)對(duì)IT基礎(chǔ)設(shè)施的性能帶來(lái)負(fù)擔(dān)。
沒(méi)有人能100%精確地做到這一點(diǎn),但借助基礎(chǔ)設(shè)施容量能力問(wèn)題分析指南,來(lái)開(kāi)發(fā)切合實(shí)際的,可應(yīng)對(duì)未來(lái)需求的預(yù)測(cè)方針。如果您企業(yè)采用一種合理的方法來(lái)規(guī)劃產(chǎn)能的增長(zhǎng),就可以證明這些要求。
圖1、一處數(shù)據(jù)中心的機(jī)柜占據(jù)了更多的地面空間,而不僅僅只是其本身的占地面積
IT人員往往傾向于只考慮機(jī)柜數(shù)量方面的問(wèn)題,但他們其實(shí)更應(yīng)該考慮數(shù)據(jù)中心的地板空間建筑面積。一臺(tái)機(jī)柜到底占據(jù)了多少空間?有一些方法能夠回答這個(gè)問(wèn)題,所以企業(yè)選擇一種切實(shí)有意義的方法,并持續(xù)使用該方法。
實(shí)際的機(jī)柜所占用的具體的數(shù)據(jù)中心空間面積都有一個(gè)特定的寬度和深度,但即使這種情況也正在改變。機(jī)柜正變得越來(lái)越大,以便能夠適應(yīng)更高的設(shè)備密度,更深的服務(wù)器形式因素和多電纜連接。30英尺寬 48英尺深(760毫米 1200毫米)外形尺寸的機(jī)柜不再是不尋常的了。
由ASHRAE TC 9.9定義的實(shí)際的機(jī)柜空間占地面積還包括了機(jī)柜周邊的過(guò)道空間(參見(jiàn)圖1)。涉及機(jī)柜的結(jié)構(gòu)樓面荷載和熱密度及其周圍的區(qū)域。如果一款設(shè)計(jì)要求4英尺(1.2米)的過(guò)道兩側(cè)安置30英尺 48英尺的機(jī)柜,那么,此時(shí)的機(jī)柜占地面積的測(cè)量就應(yīng)該是2.5英尺 8英尺或20平方英尺(1.83平方米)。您可以單獨(dú)計(jì)算機(jī)柜柜和過(guò)道區(qū)域,但這種方法可以更容易。
空白空間
總的IT工作領(lǐng)域的空間占地面積應(yīng)該是機(jī)柜的數(shù)量乘以機(jī)柜的占地面積。為了包含現(xiàn)代配電設(shè)備,每行增加另一個(gè)大型機(jī)柜。
然后考慮配套的冷卻設(shè)備和行過(guò)道盡頭所需的移動(dòng)設(shè)備,提供服務(wù)并符合消防安全規(guī)范。主通道加上冷卻設(shè)備可以很容易地從機(jī)柜占地面積空間增加75%至100%到計(jì)算出的地板空間。真正高效的設(shè)計(jì)需要更少的空間。 相反,糟糕的形狀或充滿柱子的房間會(huì)占用更多的空間面積。而借助這些數(shù)據(jù),您就不會(huì)出現(xiàn)嚴(yán)重低估或過(guò)度估計(jì)的錯(cuò)誤。對(duì)于更高的精度的估計(jì),為新的空間需求提前選擇一種電源和冷卻的方法。然而,若是以估算為目的,選擇不同的方法所帶來(lái)的差異并不特別顯著:行內(nèi)冷卻器就像額外的機(jī)柜,但要排除大部分的周邊計(jì)算機(jī)房空調(diào)(CRAC)空間;后門熱交換器增加約6英尺(150毫米)到機(jī)柜的深度,從而增加了機(jī)柜的占地面積,但消除了最標(biāo)準(zhǔn)的CRAC。
容量能力外包
若要試圖預(yù)測(cè)有多少機(jī)柜的IT容量能力將選擇去托管或租用的站點(diǎn),或者將被云實(shí)例所取代。不妨從貴公司對(duì)于外部服務(wù)的傾向的一個(gè)現(xiàn)實(shí)的評(píng)估開(kāi)始。讓貴公司的管理層 包括財(cái)務(wù)管理 參與到制定估計(jì)的過(guò)程中來(lái),以便讓企業(yè)共享業(yè)務(wù)方向,并確保對(duì)最終產(chǎn)品的支持。
提出如下指導(dǎo)方針問(wèn)題,以實(shí)現(xiàn)一個(gè)切實(shí)的容量估計(jì):
您企業(yè)的客戶流失率如何,以及所使用的系統(tǒng)是什么?頻繁改變的設(shè)備不太可能部署到異地站點(diǎn)。托管站點(diǎn)會(huì)為基礎(chǔ)設(shè)施要求的改變收取大量的費(fèi)用,因此對(duì)穩(wěn)定的運(yùn)行采取外包更為經(jīng)濟(jì)有效。取決于正在發(fā)生變化,云服務(wù)可能是更適合選擇,而不是選擇內(nèi)部硬件。列出您企業(yè)的系統(tǒng),并注意每款系統(tǒng)離開(kāi)數(shù)據(jù)中心的可能性。
您企業(yè)操作運(yùn)營(yíng)的風(fēng)險(xiǎn)承受能力如何?操作運(yùn)營(yíng)需要是高度安全的且需要規(guī)避風(fēng)險(xiǎn)的,故而不太可能考慮云服務(wù)的選項(xiàng)。托管網(wǎng)站的備用電源、冷卻和連接可能不如貴公司現(xiàn)有的數(shù)據(jù)中心可靠。單獨(dú)列出您企業(yè)的系統(tǒng)列表以便進(jìn)行風(fēng)險(xiǎn)水平分析。
在運(yùn)營(yíng)處理大的存儲(chǔ)需求時(shí),無(wú)論是存檔或鏡像操作,備份存儲(chǔ)是異地位置的一個(gè)很好的備選方案嘛?
本文中,我們使用了實(shí)際的能量消耗來(lái)描述機(jī)柜的密度。實(shí)際的功耗要比總的銘牌額定值的要少得多。銘牌額定值可能會(huì)誤導(dǎo)數(shù)據(jù)中心設(shè)計(jì)人員配置比在現(xiàn)實(shí)消耗高40%至60%的電源可用性。請(qǐng)按照以下步驟配置合適的UPS系統(tǒng)。
電源、冷卻和密度
IT基礎(chǔ)設(shè)施的空間不包括設(shè)備的空間:不間斷電源(UPS)、冷水機(jī)組、水泵、主電源中心、發(fā)電機(jī)等主要設(shè)備。作為一個(gè)經(jīng)驗(yàn)法則,為您的數(shù)據(jù)中心的不間斷的二級(jí)的設(shè)施至少多估計(jì)50%的總占地面積,為三級(jí)操作至少多估計(jì)75%,而至少為四級(jí)多估計(jì)100%。
壓縮 數(shù)據(jù)中心設(shè)備將更多的功能打包進(jìn)入了更小的外形尺寸 增加了每臺(tái)機(jī)柜所需要的電力和冷卻量。但其在實(shí)際空間需求方面所帶來(lái)的差別并不大,因?yàn)殡m然設(shè)備繼續(xù)變得更小且更強(qiáng)大,我們總是希望獲得更多。
密度并不是不斷蔓延的。盡管預(yù)測(cè)的機(jī)柜將達(dá)到25千瓦到40千瓦,但只有一小部分的數(shù)據(jù)中心機(jī)架超過(guò)了8千瓦至10千瓦,大多數(shù)仍然是在5千瓦至8千瓦的范圍內(nèi)。因此,除非您企業(yè)是一家高性能計(jì)算的研究實(shí)體,否則裝滿整整一個(gè)機(jī)房的35千瓦的機(jī)柜是不現(xiàn)實(shí)的。而進(jìn)行電力需求規(guī)劃是切實(shí)的。如果您企業(yè)的機(jī)柜配備了計(jì)量配電盤,特別是如果您使用的是數(shù)據(jù)中心基礎(chǔ)設(shè)施管理軟件。來(lái)記錄每臺(tái)機(jī)柜隨著時(shí)間的推移的功率情況,您就能準(zhǔn)確地判斷實(shí)際負(fù)荷。
表1:使用此圖表來(lái)估計(jì)數(shù)據(jù)中心的功率消耗情況。
如果您不確定當(dāng)前的功率消耗,有幾種方法來(lái)進(jìn)行估計(jì):
1. 閱讀您企業(yè)的UPS監(jiān)控顯示面板。用總的負(fù)荷除以機(jī)柜的數(shù)量來(lái)獲得每臺(tái)機(jī)柜的平均瓦數(shù)。如果您企業(yè)運(yùn)行的是2N UPS配置,每臺(tái)UPS承載一半的實(shí)際負(fù)載,所以讀取兩個(gè)系統(tǒng),把它們相加,再除以機(jī)柜的總數(shù)。同時(shí)也需要考慮異常機(jī)柜,比如,高利用率的刀片服務(wù)器每臺(tái)機(jī)柜可以運(yùn)行12千瓦。
2. 看看分支電路板的斷路器評(píng)級(jí)。斷路器應(yīng)加載到只有80%的評(píng)級(jí)一個(gè)連續(xù)的基礎(chǔ)上。使用圖表1以確定機(jī)柜電路的最大容量。如果您企業(yè)的機(jī)柜是雙線路,具有功率來(lái)自兩個(gè)不同的面板和斷路器,最大負(fù)載只能基于其中之一。
3. 安排一名電工用鉗式儀表來(lái)測(cè)量每個(gè)支路上的實(shí)際負(fù)荷。這些都是瞬時(shí)的測(cè)量,而沒(méi)有考慮到一天內(nèi)的波動(dòng),但其也有助于估計(jì)真實(shí)的機(jī)柜負(fù)載。對(duì)于雙線路機(jī)柜,從斷路器到每個(gè)機(jī)柜添加載荷。
4. 整合最高密度機(jī)柜以進(jìn)行空間預(yù)測(cè)。不必為這個(gè)級(jí)別而進(jìn)行整個(gè)數(shù)據(jù)中心的設(shè)計(jì),將其劃分為高密度和正常密度的要求,以降低成本和占地面積。為真正的高密度機(jī)柜添加25%至地板面積(15千瓦或以上),以考慮額外的功率和冷卻要求。如果您企業(yè)利用完全冗余的2N 冷卻系統(tǒng),另加25%。
設(shè)計(jì)變革
良好的設(shè)計(jì)使您企業(yè)數(shù)據(jù)中心能夠添加容量單元到基礎(chǔ)設(shè)施,而不會(huì)對(duì)操作運(yùn)營(yíng)帶來(lái)影響。這降低了初始資金預(yù)算,允許隨著業(yè)務(wù)的發(fā)展而線性的增加容量,并提高了能源效率。
堅(jiān)持為模塊化、階段化的設(shè)計(jì)進(jìn)行成本估算。沒(méi)有理由安裝最大預(yù)測(cè)的UPS和冷卻能力,以支持某一天的操作。這樣會(huì)吞噬掉您的預(yù)算。
在新的空間開(kāi)始運(yùn)行之前,有些東西必須完全安裝。管道和主接線必須到位,否則,當(dāng)利用率增長(zhǎng)時(shí),您在數(shù)據(jù)中心內(nèi)部的運(yùn)行會(huì)有相當(dāng)繁重的工作。在電氣/機(jī)械支持區(qū)域擴(kuò)建后的工作可能包括需要一次IT關(guān)閉,其會(huì)很快毀掉您企業(yè)在基礎(chǔ)設(shè)施容量能力計(jì)劃的任何成功。