
數據中心是全球協作的特定設備網絡,用來在internet網絡基礎設施上傳遞、加速、展示、計算、存儲數據信息。
在今後的發展中,數據中心也将會成爲企業競争的資産,商業模式也會因此發生改變。随着數據中心應用的廣泛化,人工智🙉能、網絡安全等也相繼出現,更多的用戶都被帶到了網🔞絡和手機的應用中。随着計算機和數據量的增多,人們也可以通過不斷學習積累😗提升自身的👱🏼♂️能力,是邁向信息化時代的重要标志。
内容簡介
數據中心的産生緻使人們的認識從定量、結構的世✋界進入到不确定和非結構的世界中,它将和交通、網🤶🏾絡通😘訊一🚶🏾♀️➡️樣逐😈漸成🎅🏿爲現代社會基礎設施的一部分,進而對很多産業都産生了積極影響。不過數據中心的發展不能僅憑經驗,還要真正的結合👨🦰實踐,促使數🏊🏾♀️據中心發揮🏃🏻♀️真正的價值作用,促使社會的快速變革。
随着數據中心行業在全球的蓬勃發展,随着社會經濟的快速增長,數據中心的發展建設将處于高速時期,再加上各地政府部門給予新興産業的大力扶持,都爲數據中心行業的發展帶來了很大的優勢。随着數據中心行業的大力發展,将來在很多城市中都會有很大的發展空間,一些大型的數據中心也會越來越多。2017年全球經曆了前所未有的自然災害之後,很多數據中心管理人員都在積極制定災難恢複計劃。例如就可以通過雲計算工具對電力使用的功率進行限制,在遭遇停電時間時将允許以降低的功率繼續運行,可以爲電力企業的正常運行提供有效的保障。還可以利用數據中心指定備份計劃,對服務器的操作進行拓展,就不需要通過關閉和重啓服務器操作。
數據中心是與人力資源、自然資源一樣重要的戰略資源,在信息時代下的數據中心行業中,隻有對數據進行大規模和靈活性的運用,才能更好的去理解數據,運用數據,才能促使我國數據中心行業快速高效發展,體現出國家發展的大智慧。海量數據的産生,也促使信息數據的收集與處理發生了重要的轉變,企業也從實體服務走向了數據服務。産業界需求與關注點也發生了轉變,企業關注的重點轉向了數據,計算機行業從追求的計算能力轉變爲數據處理能力,軟件業也将從編程爲主向數據爲主轉變,雲計算的主導權也将從分析向服務轉變。
在信息時代下,數據中心的産生,更多的網絡内容也将不再由專業網站或者特定人群所産生,而是由全🧛🏾♀️體網民共同參與。随着數據中心行業的興起,網民參與互聯網、貢獻内容也更加便捷,呈現出多元化。巨量網絡數據都能夠存儲在數據中心,數據價值也會越來越高,可靠🎅🏿性能也在進😝一步加強。 [1]
數據中心網絡常見的通訊故障主要集中在:硬件故障、系統故障兩個類别:
(1)硬件故障:
數據中心是通過無數計算機硬件組成的,硬件出現問題,就會導緻部分功能無法正常發揮或運作。無論是設🛀🏼備、線💫路、端🧑🏻❤️🧑🏼口,哪一點出現故障,都會導緻👋網絡通訊故障的出現。硬件方面的故😈障相對比較容易查找,例如線路👾故障,一般的成因就💌是線路明顯的老化或者破損,而影響到了整體網絡的運營✡️;再比如,端口故障,計算機端口作爲數據中心網絡的重要環🧎🏻♀️➡️節,若出現接觸不良、損壞等傳輸問題,就會🙆🏿影響到整體網絡的運行。硬件故障隻要進行逐一排查,就👽可以及時進行更換處理,相對比較好解👩🏿❤️💋👨🏽決。
(2)系統故障:
數據中心是計算機領域比較熱門的研究之一,因💑🏾此👀研💘究技🧜🏼♂️術🧛🏾♀️十分成熟。計算機網絡構成主要包括TREE、FAT-TREE、BCUBE、FICONN等,主要采用模塊化💞、層次化、扁平化的設計思路與虛拟化的分割管理技術,将成千上萬💘台設備,以單元爲單位進行劃分,逐一進行💁🏼♀️管理。通過分層、遞歸的結構進行聯結,盡可能的避免了所謂“關鍵節點”的存在。這樣組^合也形成了良好的冗餘與容錯性👧🏾,如果其中出現故障的某一個或某幾個單元,沒有被😁檢測出來,也不至于影響數據中心的整體運行。但是如果超出一定比例,就會在影響數據中心網🔞絡的高速運行,拉慢網絡🧜🏼♂️通訊的速度,所以仍舊需要針對性的👧🏾查找故障進行處理。 [2]
(1)分析故障現象:
一般來說由于構成組件比較複雜,故障也呈現出♌️不同的表💫現方式。因此想要對于故障進行分析,就😍要先了解👩🏼❤️👨🏾故障的現象。例如,應用方面出現了支付系統支付不了,網頁難以打開等問題,那麽就要逐一檢查相關的故障點,有哪幾個故障是上述表現,如,線路故障,端口故障等💔,就要更換線路、端口等設備。因此,需要針對數據中心網💯絡的幾種常見的故障進行收集與整理,根據現象,進行檢索、查找。
(2)測試并确認故障範圍,進行故障點定位。
所有的應用業務是在這些物理硬件正常運行的基礎上開展的,其中某些硬件出現問題就會導緻故障。根據故障的表現,需要針對各個部分進行篩選檢查,例如,對于服務器進行測試,檢查網絡設備等。針對問題表現,進行逐一排除,最終敲定故障點所在位置。
(3)如果以上硬件故障都已經排除,那麽就是計算機系🚶🏾♀️➡️統🏃🏻♀️的故障,這一故障需要建立故障模型進行診斷,根據PMC模型進行定義。通過分層測試的方法,查找問題單💞元,即正常單元測試正常單元、正常單元測✡️試故障單元、故障單👽元測試故障單元、故障單元測😥試正常單元等四種。其中後三種的檢測結果都是故障,因此就可以通過分層測量的方式,建立有限個單元,通過矩陣以及螢火蟲算法重點FAFD算法對于其他單元進行診斷,最終确定故障的系統是哪個或者哪幾個單元的。當然也可以通過鏡像、流量統計、抓包等其他手段确定故障所在的設備範圍,進而縮小🚶🏾♀️➡️範圍,集中處理某一個或者幾個設備。
(4)收集重要的數據信息。
在進行故障處理時,通過收集設備的日志、診斷、操作記錄等信息資料,将這些數據資料進行彙總,條件允🙈許的情況🔞下,建立故障數據庫,對于常見問題可以做到“出現👹即處理👻”,對于沒有出現過的故障,可🙆🏿以繼續收👽集進數據庫。總之,必要的信息收集,有利于日後更好🚶🏾♀️➡️的查找故障原因,确保數據中心網絡健康、平穩運行。 [2]
數據中心冷卻技術的發展有以下趨勢。
一、末端冷卻設備貼近服務器
以前數據中心機房普通采用房間級空調,地闆下送風的冷卻方式。該方式建設成本低,機房利用率高,用于解決3~5kW的單機櫃💌發熱。但随着機架式、刀片式服務器在機房大量應用,單機櫃内設備數量、功率密度、發熱密度都有顯著提高。傳統的機房級空調已經不能解決IT設備的散熱問題,行級空調、背闆空調應運而生。這種新型的空調末端更貼近熱源,能解決局部熱點、高發熱密度的問題,通過近距離的冷量傳輸,減小風機功耗,達到節能。不論房間級空調,還是行級空調、背闆空調,都是先冷卻空氣,再通過冷空氣與服務器的CPU進行熱交換來降溫。由于空氣的換熱效率、熱流密度很低,空冷服務器有冷卻能耗高、噪聲大、設備密度低等問題。爲解決超高功率密度IT設備散熱難題,數據中心開始采用液冷技術,使用工作流體作爲中間熱量傳輸的媒介,将熱量從發熱區傳遞到遠處再進行冷卻。液冷技術冷卻效率顯著高于風冷散熱,可有效解決高密度服務器的散熱問題,降低冷卻系統能耗而且減少噪聲。
二、重視冷卻系統節能
随着數據中心的競争加劇,運營成本的壓力增大,冷卻系統的節能研究迫在眉睫。随着耐高溫服務器的出現,越來越多的數據中心逐步嘗試開發使用free-cooling(自然冷卻)。自然冷源的利用主要有以下2種方向。
1、新風直接冷卻
典型的案例就是Facebook在美國俄勒岡州普林維爾的數據中心。室外新風經過濾處理後,進行加濕降溫,然後通過風扇牆送入機架的進風口,室外新風經服務器加熱後排到室外。這種方式對室外空氣質量的要求高,甯夏中衛的一些數據中心嘗試應用了該技術。
2、利用深層湖水、江水冷卻
典型的案例是湖南省資興市東江湖數據中心。東江湖爲我國中南地區最大的人工湖,冷水資源豐富。東😵💫江湖面積160平方千米🔞,蓄水量8.12×109立方米。其下遊小⛹🏻♂️東江水溫常年低于10℃,水💫流穩定且水質達到國家一級标準。全年90%的時間🏃🏿♀️➡️不需要機械制冷,采用江水直冷冷卻,預計年平均PUE爲1.15。 [3]
一個數據中心的主要目的是運行應用來處理商業和運作的🧛🏽組織的數據。這樣的系統屬于并由組織内部開發,或者從企業軟件供應商那裏買。像通用應用有ERP和CRM系統。一個數據中心也許隻關注于操作體系結構或者也提供其他的服務。常常這些應用由多個主機構成,每個主機運行一個單一的構件。通常這種構件是數據庫,文件服務器,應用服務器,中間件以及其他的各種各樣的東西。數據中心也常常用于非工作站點的備份。公司也許預定被數據中心提供的服務。這常常聯合備份磁帶使用。備份能夠将服務器本地的東西放在磁帶上,然而,磁帶存放場所也易受火災和洪水的安全威脅。較大的公司也許發送他們的備份到非工作場所。這個通過回投而能夠被數據中心完成。加密的備份能夠通過Internet發送到另一個數據中心,安全保存起來。爲了災難恢複,各種大的硬件供應商開發了移動設備解決方案,能夠安🙉裝并在短時間内可操作。供應商像思科系統,Sun微系統,IBM和HP開😝發的系統能夠用于這個目的。