數(shù)據(jù)中心網(wǎng)絡(luò)與互聯(lián)網(wǎng)、局域網(wǎng)的區(qū)別與聯(lián)系
數(shù)據(jù)中心網(wǎng)絡(luò)
數(shù)據(jù)中心網(wǎng)絡(luò)(data center network)指的是連接數(shù)據(jù)中心內(nèi)部的海量服務(wù)器、連接分布式數(shù)據(jù)中心以及連接數(shù)據(jù)中心與終端用戶之間的網(wǎng)絡(luò)。數(shù)據(jù)中心網(wǎng)絡(luò)是伴隨著互聯(lián)網(wǎng)服務(wù)規(guī)模的增長(zhǎng)、升級(jí),以及云計(jì)算等新型服務(wù)模式的出現(xiàn)而形成的。對(duì)于一個(gè)互聯(lián)網(wǎng)公司而言,當(dāng)其提供的服務(wù)規(guī)模較小時(shí),僅需一臺(tái)或幾臺(tái)服務(wù)器就足夠了,這時(shí)并不需要復(fù)雜的網(wǎng)絡(luò)技術(shù);但當(dāng)其所提供的互聯(lián)網(wǎng)服務(wù)增加到很大的規(guī)模(如谷歌、亞馬遜、阿里巴巴、騰訊等公司)時(shí),則需要幾十萬臺(tái)甚至數(shù)百萬臺(tái)服務(wù)器才能提供用戶所需的互聯(lián)網(wǎng)服務(wù),這時(shí)就誕生了數(shù)據(jù)中心網(wǎng)絡(luò)。
數(shù)據(jù)中心網(wǎng)絡(luò)可以分為三個(gè)部分:
1、數(shù)據(jù)中心內(nèi)部網(wǎng)絡(luò)。主要是連接數(shù)據(jù)中心內(nèi)的海量服務(wù)器,支持?jǐn)?shù)據(jù)中心服務(wù)器之間的通信需求。這部分網(wǎng)絡(luò)可以被視為一種“計(jì)算機(jī)局域網(wǎng)”,而這部分流量經(jīng)常被稱為數(shù)據(jù)中心的“東西流量”。
2、分布式數(shù)據(jù)中心之間的網(wǎng)絡(luò)。一個(gè)互聯(lián)網(wǎng)業(yè)務(wù)提供商可能修建了多個(gè)數(shù)據(jù)中心(為了異地災(zāi)備、降低延遲等多種考慮),連接這些分布式數(shù)據(jù)中心之間的網(wǎng)絡(luò),也是數(shù)據(jù)中心網(wǎng)絡(luò)的組成部分。這部分網(wǎng)絡(luò)一般是專線(自建或租用)連接,但也不排除使用電信運(yùn)營商的公共互聯(lián)網(wǎng)。
3、連接數(shù)據(jù)中心和終端用戶之間的網(wǎng)絡(luò)。大部分情況下,數(shù)據(jù)中心與終端用戶之間是通過電信運(yùn)營商的接入網(wǎng)絡(luò)來互通的,但當(dāng)前許多互聯(lián)網(wǎng)公司所修建的數(shù)據(jù)中心已經(jīng)離用戶越來越近,部分互聯(lián)網(wǎng)公司甚至有過自建網(wǎng)絡(luò)直聯(lián)用戶的做法(比如谷歌公司曾經(jīng)的“谷歌光纖”項(xiàng)目)。數(shù)據(jù)中心與終端用戶之間的流量,經(jīng)常被稱為數(shù)據(jù)中心的“南北流量”。
數(shù)據(jù)中心網(wǎng)絡(luò)與互聯(lián)網(wǎng)的關(guān)系
互聯(lián)網(wǎng)(Internet)是對(duì)“網(wǎng)絡(luò)”進(jìn)行“互聯(lián)”的“網(wǎng)絡(luò)”。IP協(xié)議(Internet Protocol)是互聯(lián)網(wǎng)最核心的協(xié)議,圍繞互聯(lián)網(wǎng)“開放與互聯(lián)”的使命而設(shè)計(jì),是互聯(lián)網(wǎng)取得巨大成功的重要原因之一。以IP協(xié)議為核心的互聯(lián)網(wǎng)技術(shù),也將成為打通行業(yè)網(wǎng)絡(luò)“孤島”、連接不同行業(yè)網(wǎng)絡(luò)的關(guān)鍵技術(shù),是貫通“新基建”中5G網(wǎng)絡(luò)、工業(yè)互聯(lián)網(wǎng)、衛(wèi)星互聯(lián)網(wǎng)、數(shù)據(jù)中心網(wǎng)絡(luò)等不同網(wǎng)絡(luò)的“血管”,是更“全局”、更“基礎(chǔ)”的基礎(chǔ)設(shè)施技術(shù)。
世界上并不存在所謂的“互聯(lián)網(wǎng)運(yùn)營商”,因?yàn)榛ヂ?lián)網(wǎng)本身是一個(gè)完全分布式的架構(gòu)。我們常說的互聯(lián)網(wǎng)服務(wù)提供商(Internet Service Provider,ISP),其實(shí)是為不具備網(wǎng)絡(luò)部署能力的機(jī)構(gòu)或個(gè)人提供互聯(lián)網(wǎng)接入”服務(wù)的公司,一旦網(wǎng)絡(luò)部署完成,ISP并不能成為這些網(wǎng)絡(luò)的“管理者”或“運(yùn)營者”(ISP可以協(xié)助運(yùn)維)。從理論上講,任何一個(gè)“網(wǎng)絡(luò)”要想加入“互聯(lián)網(wǎng)”,只要申請(qǐng)到IP地址、AS號(hào)等基本互聯(lián)網(wǎng)資源就可以了,數(shù)據(jù)中心網(wǎng)絡(luò)也是一樣。如今,很多大型互聯(lián)網(wǎng)公司的數(shù)據(jù)中心網(wǎng)絡(luò)都有完全獨(dú)立的AS號(hào)、IP地址段等。
數(shù)據(jù)中心網(wǎng)絡(luò)已經(jīng)成為互聯(lián)網(wǎng)基礎(chǔ)設(shè)施的重要組成部分。值得注意的是,數(shù)據(jù)中心網(wǎng)絡(luò)加入互聯(lián)網(wǎng)的部分,既包括傳統(tǒng)意義上的“計(jì)算機(jī)局域網(wǎng)”(即單個(gè)數(shù)據(jù)中心的內(nèi)部網(wǎng)絡(luò)),也包括傳統(tǒng)意義上的“廣域網(wǎng)”(即分布式數(shù)據(jù)中心之間的網(wǎng)絡(luò))。如果互聯(lián)網(wǎng)公司直接提供光纖到戶服務(wù),那就相當(dāng)于把電信運(yùn)營商直接“旁路”了(這種做法并不經(jīng)濟(jì),因此“谷歌光纖”項(xiàng)目被停掉了)。
因?yàn)榧尤肓嘶ヂ?lián)網(wǎng),所以數(shù)據(jù)中心網(wǎng)絡(luò)的所有行規(guī)則與互聯(lián)網(wǎng)無異了,這些運(yùn)行規(guī)則包括但不限于:(1)通過運(yùn)行域間路由協(xié)議,向外發(fā)布數(shù)據(jù)中心網(wǎng)絡(luò)的IP地址前綴及路由;(2)數(shù)據(jù)中心網(wǎng)絡(luò)內(nèi)的每臺(tái)服務(wù)器都分配一個(gè)IP地址;(3)數(shù)據(jù)中心網(wǎng)絡(luò)中的每個(gè)節(jié)點(diǎn)運(yùn)行TCP/IP協(xié)議棧,與互聯(lián)網(wǎng)其他部分交互的報(bào)文都要封裝一個(gè)IP頭部。當(dāng)然,數(shù)據(jù)中心網(wǎng)絡(luò)內(nèi)部服務(wù)器之間交互的流量,其協(xié)議棧的選擇相對(duì)靈活,比如可以采用“大二層網(wǎng)絡(luò)”(用MAC地址轉(zhuǎn)發(fā)),也可以采用RoCE(RDMA over Converged Ethernet)協(xié)議棧,但就算在這兩種情況下,一般也會(huì)給報(bào)文封裝PP頭部(但不一定用P地址來轉(zhuǎn)發(fā))。
數(shù)據(jù)中心內(nèi)部網(wǎng)絡(luò)與傳統(tǒng)局域網(wǎng)的區(qū)別
數(shù)據(jù)中心內(nèi)部網(wǎng)絡(luò)本質(zhì)上屬于計(jì)算機(jī)局域網(wǎng),與園區(qū)網(wǎng)、企業(yè)辦公網(wǎng)絡(luò)等其他的傳統(tǒng)計(jì)算機(jī)局域網(wǎng)相比,存在以下特點(diǎn):
1、數(shù)據(jù)中心內(nèi)部網(wǎng)絡(luò)的流量主要是機(jī)器產(chǎn)生的,而傳統(tǒng)的園區(qū)網(wǎng)、企業(yè)網(wǎng)的流量主要是人產(chǎn)生的。數(shù)據(jù)中心把大規(guī)模的服務(wù)器進(jìn)行互聯(lián)通信,不管是數(shù)據(jù)中心網(wǎng)絡(luò)的內(nèi)部流量,還是數(shù)據(jù)中心與終端用戶之間的通信流量,都是機(jī)器產(chǎn)生的。因此數(shù)據(jù)中心網(wǎng)絡(luò)的流量往往具有突發(fā)性強(qiáng)、缺乏規(guī)律性的特點(diǎn),流量的可預(yù)測(cè)性不強(qiáng)。
2、數(shù)據(jù)中心內(nèi)部網(wǎng)絡(luò)的鏈路密集、拓?fù)湟?guī)整性強(qiáng)。與園區(qū)網(wǎng)、企業(yè)網(wǎng)等相比,數(shù)據(jù)中心網(wǎng)絡(luò)主要是把海量服務(wù)器進(jìn)行互聯(lián),這些服務(wù)器都被密集地放置,因此服務(wù)器之間的鏈路也非常密集。為了讓這些服務(wù)器進(jìn)行更好的互聯(lián)通信,服務(wù)器之間的互聯(lián)拓?fù)湟餐哂休^強(qiáng)的規(guī)整性,比如fat-tree(胖樹)、VL2、BCube等拓?fù)洹?/span>
3、數(shù)據(jù)中心內(nèi)部網(wǎng)絡(luò)的端到端帶寬極高、延遲極低。由于當(dāng)前的互聯(lián)網(wǎng)服務(wù)規(guī)模不斷增加,數(shù)據(jù)中心網(wǎng)絡(luò)產(chǎn)生的流量極高,服務(wù)器之間的端到帶寬當(dāng)前已經(jīng)達(dá)到100Gbps,未來還會(huì)繼續(xù)增長(zhǎng);而園區(qū)網(wǎng)、企業(yè)網(wǎng)的端到端帶寬大部分情況下是在MGBps級(jí)別。由于數(shù)據(jù)中心網(wǎng)絡(luò)連接的服務(wù)器之間距離很近,帶寬又極高,因此服務(wù)器之間的端到延遲極低,往往在微秒級(jí)別;而園區(qū)網(wǎng)、企業(yè)網(wǎng)的端到端延遲較高,一般在毫秒級(jí)別。
數(shù)據(jù)中心內(nèi)部網(wǎng)絡(luò)與超級(jí)計(jì)算機(jī)內(nèi)部網(wǎng)絡(luò)的區(qū)別
由于數(shù)據(jù)中心是把大量服務(wù)器(計(jì)算節(jié)點(diǎn))相連,讓人很容易將其與超級(jí)計(jì)算機(jī)聯(lián)想到一起。但是,數(shù)據(jù)中心網(wǎng)絡(luò)與超級(jí)計(jì)算機(jī)的內(nèi)部網(wǎng)絡(luò)還存在以下區(qū)別:
1、大部分?jǐn)?shù)據(jù)中心是商業(yè)公司所擁有的,因此在技術(shù)選擇上更看重“性價(jià)比”,而非“絕對(duì)性能”。所以,數(shù)據(jù)中心網(wǎng)絡(luò)往往采用TCP/IP/Ethernet這樣的互聯(lián)網(wǎng)技術(shù)協(xié)議棧,因?yàn)檫@一類協(xié)議棧所對(duì)應(yīng)的硬件設(shè)備成本較低。而超級(jí)計(jì)算機(jī)的內(nèi)部網(wǎng)絡(luò)主要看重性能,采用的是InfiniBand這樣的通信協(xié)議棧。
2、由于數(shù)據(jù)中心網(wǎng)絡(luò)側(cè)重于“性價(jià)比”的考慮,往往采用較為“廉價(jià)”的硬件設(shè)備,因此網(wǎng)絡(luò)協(xié)議的設(shè)計(jì)中需要考慮容錯(cuò)性。這與數(shù)據(jù)中心MapReduce、HDFS等分布式計(jì)算或分布式存儲(chǔ)系統(tǒng)的設(shè)計(jì)思想一致,即通過軟件上的設(shè)計(jì),在相對(duì)“低端”“不可靠”的硬件設(shè)備上實(shí)現(xiàn)高性能的系統(tǒng)性能。而超級(jí)計(jì)算機(jī)的內(nèi)部網(wǎng)絡(luò)往往通過硬件手段(比如備份硬件)來解決容錯(cuò)問題。