當(dāng)前位置:首頁>一起惠資訊>購物資訊>百度AI的底氣從何而來?
百度AI的底氣從何而來?
一起惠2019-04-12 09:13:39377 次

2018年底,百度宣布技術(shù)體系架構(gòu)整合ABC智能云事業(yè)部升級為智能云事業(yè)群組(ACG),同時承載人工智能toB業(yè)務(wù)和云業(yè)務(wù);搜索公司及各BG的運(yùn)維、基礎(chǔ)架構(gòu)和集團(tuán)級共享平臺整合至基礎(chǔ)技術(shù)體系(TG)。

百度創(chuàng)始人、董事長李彥宏稱此次組織架構(gòu)調(diào)整將強(qiáng)化集中資源“打大仗、打硬仗”的能力,幫助百度客戶完成智能化轉(zhuǎn)型、早日邁入AI時代。“百度將打造AI時代最領(lǐng)先的技術(shù)平臺,實(shí)現(xiàn)前端業(yè)務(wù)和技術(shù)平臺的資源高效統(tǒng)籌及組織全面協(xié)同?!?/span>

而數(shù)據(jù)中心作為上述一切業(yè)務(wù)的基礎(chǔ),是百度發(fā)力AI的根基。

目前,百度在陽泉、順義、南京等地區(qū)都已部署數(shù)據(jù)中心。本周,鈦媒體探訪了百度陽泉云計算中心,該中心是百度自建的第一個超大規(guī)模數(shù)據(jù)中心,也是亞洲規(guī)模最大的數(shù)據(jù)中心。

如圖所示,陽泉云計算中心分為八個模組樓,而每一個區(qū)域則通過一條環(huán)狀長廊連接在一起,在發(fā)生緊急狀況時工作人員能夠靈活調(diào)度。

就在剛剛過去的2019年春節(jié),百度抗住了春晚紅包互動活動的數(shù)據(jù)流沖擊,陽泉云計算數(shù)據(jù)中心功不可沒。

“春晚的數(shù)據(jù)流可以用驚濤駭浪來形容。全球觀眾互動次數(shù)達(dá)到208億次,春晚數(shù)據(jù)流量預(yù)計每秒峰值5000萬次,每分鐘峰值10億次?!卑俣认到y(tǒng)部總監(jiān)張炳華說道。

靠近用戶的陽泉云計算中心

目前,百度在陽泉、順義、南京等多個地區(qū)都已部署數(shù)據(jù)中心。其中,陽泉中心是百度自建的第一個超大規(guī)模數(shù)據(jù)中心,從2011年9月選址到2018年9月一期整體交付,歷時7年,直至今日,陽泉云計算中心仍在不停的建設(shè)、擴(kuò)展中。

百度陽泉云計算中心規(guī)劃建筑面積超過20萬平米,按照T3+標(biāo)準(zhǔn)設(shè)計,服務(wù)器裝機(jī)能力超過28萬臺。一期已建成投產(chǎn)建筑面積約12萬平方米,建設(shè)涵蓋8個高標(biāo)準(zhǔn)模組樓,機(jī)房滿載可提供約6000個40A機(jī)柜、承載16萬多臺服務(wù)器。為百度智能云、百度App、百度地圖、智能城市、小度、Apollo等百度內(nèi)外部的產(chǎn)品和廠商提供強(qiáng)勁的計算能力。

選址

張炳華表示,百度在東、南、西北各大區(qū)都有數(shù)據(jù)中心選址布局,和大部分公司一樣,具體選到哪可能有各種因素考量,從技術(shù)上看,主要考察以下6個方面的因素,最后綜合平衡選擇。

第一,就是環(huán)境地理條件。遠(yuǎn)離地震、海嘯、臺風(fēng)等自然災(zāi)害地區(qū)的,除此之外,還要考慮氣候條件,氣候適宜有利于降低成本;第二,政策支持力度 ;第三,電力、水力的豐富度,豐富的電力和水源供應(yīng),是建設(shè)數(shù)據(jù)中心的必備條件;而且,電價也是要重點(diǎn)考量因素,電力成本占運(yùn)營成本的60、70%;第四,網(wǎng)絡(luò)技術(shù)條件,地方很好,政策也好,網(wǎng)絡(luò)接入能力好不好,能不能接入運(yùn)營商骨干網(wǎng),也是選址需要重點(diǎn)考慮的點(diǎn);第五,交通環(huán)境;第六,人才條件。而選擇在陽泉,則是考慮百度的業(yè)務(wù)類型,以及靠近用戶,提升用戶體驗。

據(jù)介紹,目前百度陽泉云計算中心使用百度自主研發(fā)高性能交換機(jī),提供超大規(guī)模的網(wǎng)絡(luò)吞吐能力,支持10G、25G的通用計算網(wǎng)絡(luò)接入和100G的AI高速無損網(wǎng)絡(luò)互聯(lián)技術(shù)。

在數(shù)據(jù)中心外部,百度網(wǎng)絡(luò)構(gòu)建了三個時延圈:從數(shù)據(jù)中心覆蓋用戶時延不超過30ms,從POP點(diǎn)覆蓋用戶的時延不超過10ms,從CDN覆蓋用戶的時延不超過2ms,確保全國用戶的全面覆蓋和就近接入。在數(shù)據(jù)中心內(nèi)部,百度通過大帶寬、低時延、無損網(wǎng)絡(luò),把數(shù)據(jù)中心數(shù)十萬臺服務(wù)器連接成為一個超級計算機(jī)。

優(yōu)化

數(shù)據(jù)中心建設(shè)周期長,在規(guī)劃過程中必須具備前瞻性。在這幾年陸續(xù)建設(shè)過程中,各種先進(jìn)技術(shù)都在逐漸被運(yùn)用到陽泉云計算中心。其中,數(shù)據(jù)中心模塊化技術(shù)、整機(jī)柜服務(wù)器技術(shù)成為了數(shù)據(jù)中心國家技術(shù)標(biāo)準(zhǔn)。其他不斷成熟應(yīng)用的領(lǐng)先技術(shù)包括AHU風(fēng)扇墻、市電直供+HVDC、OCU等等。

目前,該中心已上線服務(wù)器超過15萬臺、年均PUE低至1.09、超過300萬個CPU核、存儲容量超過了6EB。

張炳華介紹到,PUE(Power Usage Effectiveness,電力使用效率),是國際上通行的衡量數(shù)據(jù)中心能源效率的指標(biāo),PUE值是指數(shù)據(jù)中心總能耗(供電、制冷、照明、IT)與IT能耗之比。PUE值越接近于1,表示效率越高。

“數(shù)據(jù)中心成本中,電力成本占了60%-70%,降低PUE,可以直接降低數(shù)據(jù)中心的運(yùn)營成本,提高產(chǎn)品的競爭能力。通過技術(shù)創(chuàng)新,提高數(shù)據(jù)中心能效,對行業(yè)有極大的示范作用和帶動作用,同時,可以減少能源消耗,減少CO2排放?!?/span>

百度陽泉云計算中心監(jiān)控中心,如屏幕所示,實(shí)際當(dāng)天的PUE為1.06,還要低于1.09這一數(shù)值。

除了PUE以外,數(shù)據(jù)中心的機(jī)架規(guī)模、功率密度、運(yùn)行穩(wěn)定性、運(yùn)營成本等,都是數(shù)據(jù)中心的核心指標(biāo)。

對標(biāo)國際巨頭,百度陽泉云計算中心數(shù)據(jù)中心單體規(guī)模、算力、存儲容量方面上非常強(qiáng)大,比如:采用“天蝎”整機(jī)柜服務(wù)器、“冰山”冷存儲系統(tǒng)、“X-MAN”AI超級計算平臺等;在數(shù)據(jù)中心基礎(chǔ)設(shè)施架構(gòu)非常領(lǐng)先,比如:高效供電、免費(fèi)冷卻、智能控制,并與服務(wù)器、網(wǎng)絡(luò)設(shè)備間的協(xié)同創(chuàng)新,達(dá)到最佳匹配效果。

安全

業(yè)務(wù)安全及用戶體驗對于任何一個數(shù)據(jù)中心來說都是至關(guān)緊要的。百度智能云產(chǎn)業(yè)智能化業(yè)務(wù)負(fù)責(zé)人李碩介紹到,百度采用分層機(jī)制,基本能夠做到N+1的服務(wù)模式,即一個用戶可以通過多個入口來訪問百度的服務(wù),若訪問數(shù)據(jù)時物理服務(wù)器出現(xiàn)故障,會通過智慧調(diào)度系統(tǒng)實(shí)現(xiàn)分層處理。

“對于相對比較冷的數(shù)據(jù),比如陽泉和青島各有備份,在網(wǎng)盤中就不會有對應(yīng)的數(shù)據(jù),但即使該數(shù)據(jù)在10年內(nèi)沒有被用到,我們當(dāng)前在使用時也能很快訪問到,這個是和底層完全剝離的。如果是非?;鸬臄?shù)據(jù),會在多個系統(tǒng)中增加備份,這樣南方的用戶可以在廣州訪問,北方的用戶可以在陽泉或青島訪問?!?/span>

李碩表示:“隨機(jī)關(guān)掉百度的任何一個數(shù)據(jù)中心,我們訪問依舊沒有任何問題,到今天為止依然是這樣,這是上層服務(wù)設(shè)計需要做到的?!?/span>

在管理上,陽泉數(shù)據(jù)中心與北京總部實(shí)時聯(lián)動。陽泉數(shù)據(jù)中心團(tuán)隊主要負(fù)責(zé)數(shù)據(jù)中心7*24時值班,負(fù)責(zé)現(xiàn)場運(yùn)營管理、故障處理和維護(hù)保養(yǎng),業(yè)務(wù)層面的部署和調(diào)度由總部統(tǒng)一調(diào)度。

為百度AI提供超強(qiáng)算力

2018年底,百度剛剛發(fā)布自主研發(fā)的超級AI計算平臺X-MAN3.0。該平臺專為AI深度學(xué)習(xí)場景優(yōu)化設(shè)計,每秒完成2000萬億次深度神經(jīng)網(wǎng)絡(luò)計算,極大的加快了AI深度學(xué)習(xí)模型的訓(xùn)練速度。

就在陽泉云計算中心,鈦媒體看到了“傳說中”的AI計算集群?!袄浒迨揭豪浼夹g(shù)已經(jīng)在百度X-MAN 2.0上規(guī)模應(yīng)用了?!睋?jù)張炳華介紹,2017年上線的X-MAN 2.0,是國內(nèi)首個采用液體冷卻技術(shù)的GPU解決方案,實(shí)現(xiàn)了超高的散熱效率,規(guī)模應(yīng)用后,可以去除制冷機(jī)組,全面實(shí)現(xiàn)無冷機(jī)運(yùn)行。

目前,陽泉云計算中心是由CPU通用計算+GPU異構(gòu)計算+XPU新一代AI處理架構(gòu)所組成的強(qiáng)大算力平臺。不僅僅是百度搜索、度秘、智能云、基礎(chǔ)技術(shù)、新興業(yè)務(wù)的基礎(chǔ),更是百度發(fā)力人工智能、自動駕駛、AI的重要基石。

張炳華對鈦媒體說道,這些算力平臺定義了AI時代的基礎(chǔ)設(shè)施標(biāo)準(zhǔn),并為百度AI技術(shù)多年積累和業(yè)務(wù)實(shí)踐的集大成——百度大腦提供了強(qiáng)大的算力平臺。而算力平臺之上的百度大腦,則為百度的AI業(yè)務(wù)提供了強(qiáng)有力的算法和數(shù)據(jù)支持。

“我們都希望通過開源和開放,把中國的數(shù)據(jù)中心產(chǎn)業(yè)生態(tài)做好,縮小與國際先進(jìn)水平的差距,大家一起想辦法把蛋糕做大,把規(guī)模效益做起來,這樣的話,每個參與者都是受益者。ODCC每年發(fā)布的幾十項成果,這些成果都是由各個會員單位貢獻(xiàn)的,這些個成果都是開放的。隨著這個生態(tài)的規(guī)模越來越大,產(chǎn)業(yè)鏈越來越成熟,也越來越得到行業(yè)的認(rèn)可。”

上一篇:市場規(guī)模達(dá)千億 閑魚計劃三年培育10萬玩家

下一篇:在“英脫歐”下 跨境賣家或遇多重打擊


聲明:本站部分信息來自互聯(lián)網(wǎng),轉(zhuǎn)載的目的在于傳遞更多信息及用于網(wǎng)絡(luò)分享,并不代表本站贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé),也不構(gòu)成任何其他建議。如果您發(fā)現(xiàn)網(wǎng)站上有侵犯您的知識產(chǎn)權(quán)的作品,請與我們?nèi)〉寐?lián)系,我們會及時修改或刪除