根據(jù)The Platform網(wǎng)站最近發(fā)布的一篇文章,我們可以看到在高性能計(jì)算領(lǐng)域,整體設(shè)施的構(gòu)建、采購(gòu)以及機(jī)房共置等任務(wù)確實(shí)難于完成。為了能夠更透徹地理解這兩種觀點(diǎn)的思維方式,我們采用了Rescale方面提供的一些數(shù)字——這是一家高性能計(jì)算云服務(wù)供應(yīng)商(如前所述,主要負(fù)責(zé)將軟件與高性能計(jì)算獨(dú)立軟件開發(fā)商相對(duì)接方面的工作)。
下面提到的各項(xiàng)數(shù)字來自Rescale公司對(duì)于內(nèi)部高性能計(jì)算集群與租賃云供應(yīng)商容量及許可所進(jìn)行的一次成本比較。這些數(shù)字體現(xiàn)了一臺(tái)典型的中端集群在處理高性能計(jì)算工作負(fù)載時(shí)所帶來的使用成本——注意,這里并沒有考慮任何高端處理器或者加速方案。在一篇探討高性能計(jì)算云服務(wù)使用成本的文章中,Rescale公司CEO Joris Poort解釋稱,這主要是為了體現(xiàn)最終用戶的中位成本水平——一部分需要高到極致的性能表現(xiàn),另一些則更關(guān)注成本因素,因此這些數(shù)字僅作為基準(zhǔn)參考。當(dāng)然,一旦新型Haswell處理器或者InfiniBand等其它高成本要素被加入進(jìn)來,基礎(chǔ)成本無疑將顯著提高——特別是在采購(gòu)集群設(shè)備的頭一年時(shí)間當(dāng)中。
在以上配置條件下,用戶在物理數(shù)據(jù)中心內(nèi)運(yùn)維一臺(tái)典型的100節(jié)點(diǎn)集群,則每月需要承擔(dān)近7萬美元固定成本,其中約1萬6千美元被用在了能源消耗及冷卻方面開支當(dāng)中。Poort提供的統(tǒng)計(jì)數(shù)字當(dāng)中還包含一位負(fù)責(zé)管理該集群的全職工程師的薪酬。他同時(shí)強(qiáng)調(diào)稱,對(duì)于大多數(shù)用戶、甚至是已經(jīng)開始向云端過渡的用戶而言,這一職位都仍然切實(shí)存在,因?yàn)槠髽I(yè)內(nèi)部往往繼續(xù)運(yùn)行著大量工作負(fù)載。
接下來我們可以看到Poort所提供的典型集群的具體成本構(gòu)成:
這僅僅是集群運(yùn)維方面的支出,Poort表示實(shí)際情況還應(yīng)當(dāng)考慮到集群的整體擁有成本,包括技術(shù)支持團(tuán)隊(duì)以及其它服務(wù)項(xiàng)目所帶來的超出表格范疇之外的支出,其每月整體成本約為11萬美元。有趣的是,硬件相關(guān)成本僅為4萬美元左右,但其它運(yùn)維(包括供電、人員以及其它相關(guān)費(fèi)用)卻高達(dá)7萬美元之巨。
這個(gè)數(shù)字聽起來確實(shí)不低,尤其是考慮到企業(yè)往往會(huì)把為高性能計(jì)算資源準(zhǔn)備的預(yù)算按部門加以進(jìn)一步劃分。舉例來說,在某些企業(yè)當(dāng)中,帶寬方面的成本預(yù)算被納入到整體帶寬使用量監(jiān)控機(jī)制當(dāng)中。電力消耗也是如此,這部分支出往往并不會(huì)被直接劃撥給高性能計(jì)算集群,因?yàn)閿?shù)據(jù)中心內(nèi)部還包含有其它設(shè)備所帶來的能源成本。雖然這些資金都會(huì)由企業(yè)負(fù)責(zé)提供,但Poort表示直接列出數(shù)字的方式更加容易理解——此處的統(tǒng)計(jì)結(jié)果屬于將各項(xiàng)開銷直接累加得到的總和,其中可能也包括一部分被算在高性能計(jì)算部門頭上的、實(shí)際由其它部門使用的支出項(xiàng)目。
考慮到這一點(diǎn),將整體成本準(zhǔn)確拆分為每小時(shí)運(yùn)營(yíng)開支確實(shí)有些難度,特別是考慮到多數(shù)情況下我們往往只能基于不同硬件單獨(dú)進(jìn)行計(jì)算。換言之,計(jì)算結(jié)果中往往缺失了前面所列舉的整體運(yùn)營(yíng)與數(shù)據(jù)中心日常成本。在這里我們姑且將滿載運(yùn)轉(zhuǎn)情況下的每計(jì)算核心使用成本按照每小時(shí)10美分計(jì)算,當(dāng)然不同企業(yè)由于情況有別、計(jì)算結(jié)果則可能出現(xiàn)明顯差異。“如果大家只加入電力消耗費(fèi)用而沒有包含整體數(shù)據(jù)中心成本,那么每計(jì)算核心每小時(shí)的使用成本可能只需要5美分。這從表面上看似乎沒什么差別,但這樣的成本水平已經(jīng)比我們的計(jì)算方式高出25%——再加上其它設(shè)施支出與元素所帶來的負(fù)擔(dān),最終差異將極為明顯,”Poort解釋道。這種節(jié)約效果可能稱不上立竿見影,但卻絕對(duì)是兩種方案之間的重要差別,而且隨著時(shí)間的推移、這種差別將愈發(fā)顯著。
美中不足的是,每計(jì)算核心每小時(shí)10美分的使用成本只適用于滿負(fù)載運(yùn)轉(zhuǎn)這一假定前提之下,具體如下表所示。“在評(píng)估此類成本時(shí)經(jīng)常出現(xiàn)的另一大誤區(qū)在于,當(dāng)人們審視自己在云環(huán)境下使用服務(wù)器的開銷時(shí),往往會(huì)單純從表面理解、認(rèn)為其成本比親自購(gòu)買服務(wù)器并接入基礎(chǔ)設(shè)施更高。有鑒于此,我們需要強(qiáng)調(diào)一點(diǎn),也就是資源利用率方面的差別——在云環(huán)境下,我們可以隨時(shí)開啟并關(guān)閉自己租賃的設(shè)備。而在非使用時(shí)段中,它們完全不會(huì)帶來任何成本,”Poort指出。