您當(dāng)前的位置是:  首頁 > 新聞 > 文章精選 >
 首頁 > 新聞 > 文章精選 >

專訪騰訊云沙開波:從無到有、打造全球領(lǐng)先調(diào)度系統(tǒng)

--大咖訪談錄

2018-04-23 14:50:04   作者:   來源:CTI論壇   評論:0  點擊:


  ”說到程序員,很多人腦海中會想到什么?是一群身著格子襯衣、背著雙肩包的“碼農(nóng)”?
  從今天開始,我們帶你認(rèn)識一群不同的程序員。
  他們是來自騰訊云背后的技術(shù)大咖。他們熱愛技術(shù),用“匠人”精神在工作中不斷闖關(guān)升級。讓我們在新欄目“大咖訪談錄”里一起分享他們的故事和經(jīng)歷吧。
  “以前每個周末都去跑跑步、打打球,現(xiàn)在回家就是接接小孩,隨著年齡的增長,很多愛好都丟了。”
  沙開波——騰訊云計算產(chǎn)品總監(jiān),從一名基礎(chǔ)架構(gòu)組的程序員,到如今的計算產(chǎn)品總監(jiān),這已是他在騰訊的第9個年頭。
  在騰訊云內(nèi)部,他是著名的大規(guī)模調(diào)度系統(tǒng)VStation的技術(shù)負(fù)責(zé)人,同事們喜歡稱他“老沙”。
  VStation是騰訊云自主研發(fā)的革命性虛擬化平臺,承載了CVM 后臺整體集群管理與系統(tǒng)調(diào)度。VStation為騰訊云 CVM 業(yè)務(wù)的爆發(fā)式增長提供了堅實的技術(shù)基礎(chǔ),目前,單集群可以調(diào)度10萬臺計算機。
  時間回到2009年,初入騰訊的沙開波,就職于騰訊B2(Business2)研發(fā)部的基礎(chǔ)架構(gòu)組,也就是大家熟知的QQ空間、QQ會員、Q鉆等業(yè)務(wù)基礎(chǔ)架構(gòu)組。沙開波表示:“2009年5月份來到騰訊,那個時候還沒有騰訊云這個業(yè)務(wù)。”
  “我還是比較偏技術(shù)的,自己對技術(shù)這塊也比較感興趣,當(dāng)一個技術(shù)難點被解決后,成就感會瞬間爆表,我覺得每個做技術(shù)的應(yīng)該都有這樣的感覺。”
  從2009年對云嘗試,到2011年正式投入,再到2013年正式開放,最后到今天的成果,沙開波是騰訊云成長的見證人,而伴隨騰訊云逐漸走向成熟,沙開波也逐漸從技術(shù)走向了管理。
  他的角色發(fā)生了改變,將更大的精力放在業(yè)務(wù)規(guī)劃、整體技術(shù)架構(gòu)以及人才梯隊建設(shè)等上面。“雖然現(xiàn)在已經(jīng)很少寫代碼,但是我并不擔(dān)心淘汰或者落伍,最起碼,現(xiàn)在同事問我一些技術(shù)層面問題,我還能解決,”老沙笑著說。
  1、5千節(jié)點是一道坎10萬節(jié)點的技術(shù)難度可想而知
  從技術(shù)轉(zhuǎn)向管理,沙開波并不認(rèn)為這是他技術(shù)人生的轉(zhuǎn)折點。然而,當(dāng)一個“吹毛求疵”的“技術(shù)宅”走上管理崗,會擦出什么樣的火花?騰訊云分布式調(diào)度系統(tǒng)VStation的成績足以說明。
  “我們研究了國內(nèi)外主要的大規(guī)模調(diào)度系統(tǒng),不要說單集群10萬,就是幾千節(jié)點,一般的調(diào)度系統(tǒng)都很容易出現(xiàn)問題。”
  大家熟悉的OpenStack項目就是如此。要管理10萬級別的計算機這樣大規(guī)模的調(diào)度系統(tǒng),國內(nèi)外沒有任何已有的系統(tǒng)和資料可以參考。對于騰訊云來說,只有從零開始,而且要做就做到最好。
  技術(shù)上,5千節(jié)點是一道大的門檻, 業(yè)界知名的Google、Amazon云平臺都遇到過大規(guī)模停機的事情,很多問題你是無法預(yù)料到的。只有經(jīng)歷大規(guī)模部署,有些問題才會出現(xiàn),所以背后的技術(shù)難度可想而知。
  “從開始決定做這個系統(tǒng)之后,我們就從各個技術(shù)小組抽調(diào)了10來個人,聯(lián)合攻堅。前后1-2個月時間,就把系統(tǒng)做出來了,這個系統(tǒng)背后的每一條代碼都是我們自己從無到有開發(fā)出來的。”沙開波介紹說。
  “我的個性是這樣的,只要有一個事情放在那個地方?jīng)]有解決的話,就會白天想、晚上想。”按照沙開波的描述,出身技術(shù)的他本身就是一個技術(shù)狂,或者說是工作狂。通常情況下,一個任務(wù)布置下來,兩個星期交付都沒有問題,但沙開波卻一定要盡可能兩天把它做出來,然后留更多的時間去完善。
  2、“我們的目標(biāo)是5秒創(chuàng)建虛擬機”
  騰訊云分布式調(diào)度系統(tǒng)VStation通過消息壓縮、鏡像緩存、快照回滾等系列優(yōu)化實踐,實現(xiàn)了生產(chǎn)吞吐率從數(shù)百臺 /分鐘到數(shù)萬臺 /分鐘、平均創(chuàng)建時間由 300秒下降到 30秒以下的驚人蛻變。
  在談到VStation升級問題時,沙開波非常興奮,并表示騰訊云內(nèi)部的目標(biāo)“希望虛擬機在5秒到10秒之間就可以創(chuàng)建出來,并希望通過軟硬結(jié)合的方式,降低虛擬化帶來性能損耗的問題。”
  從30秒降到10秒以內(nèi),對于技術(shù)來說又是一次質(zhì)的飛躍。沙開波深知,這個計劃如果完成,對于整個騰訊云技術(shù)來說,將是又一次洗禮,但是這個沒有退路。
  創(chuàng)建速度快,意味著用戶體驗更好。站在用戶的立場,如果能夠快速的幫助企業(yè)創(chuàng)建出來,這不僅僅是時間的問題,更多的是對用戶業(yè)務(wù)上的幫助。“我們在團隊里一直強調(diào),我們做彈性計算,首先計算要能彈,能快速地去交付給用戶,如果創(chuàng)建一個機器需要幾分鐘,一個小時才能拿到的話,這不叫云計算!”
  關(guān)于創(chuàng)建速度的問題,沙開波直言不諱:“從目前來看,我們的創(chuàng)建速度非常有競爭力,即便和國內(nèi)外更早布局云計算的公有云廠商對比,我們也有足夠的自信。”
  另外,云計算最開始考慮的是如何把計算或網(wǎng)絡(luò)跟物理機解耦,其中虛擬化技術(shù)起到了關(guān)鍵的作用。但不可否認(rèn),云變成一個基礎(chǔ)設(shè)施的時候,虛擬化雖占盡優(yōu)勢,但卻增加了性能上的損耗,其中包括網(wǎng)絡(luò)、存儲等等。
  而在采訪中,沙開波也表示這也是騰訊云所關(guān)注的問題。“我們正在做一些軟硬結(jié)合的工作,來降低虛擬化帶來性能損耗的問題,不論是網(wǎng)絡(luò)還是存儲,我們最終目標(biāo)還是彈性的計算,希望用戶可以按需獲得媲美物理計算資源的彈性云計算資源。”
  3、用戶是最好的“裁判員”,“靠近”才能明晰方向
  在沙開波的眼中,用戶才是最好的“裁判員”,所有的技術(shù)升級和突破,歸根結(jié)底就是要讓技術(shù)普惠化,讓技術(shù)為人所用。
  不可否認(rèn)的一條市場定律,“需求才是生產(chǎn)力”;蛟S正是沙開波想法的詮釋。據(jù)了解,騰訊云產(chǎn)品的優(yōu)先級是基于客戶的需求來的,很多產(chǎn)品和技術(shù)都是來自于客戶實際的想法以及真實的訴求。
  沙開波也正在帶領(lǐng)團隊走近用戶。“今年從上到下希望離用戶更近一點,也多跟客戶去聊,了解客戶的訴求和需求”。他透露這是2018年重點要去改變的方向。
  正如沙開波口中“裁判員”的說法,一個產(chǎn)品團隊產(chǎn)品做得好和不好,客戶的評價往往是最中肯、實用的。在談及工作中遇到的問題、以及如何解決問題的時候,沙開波描述了他們解決問題的思路。
  “先去幫助客戶去解決問題,虛心接受客戶的吐槽,之后再優(yōu)化產(chǎn)品。”
  以這樣的工作理念,沙開波在騰訊已經(jīng)走過了9年的時間。目前,在沙開波眼中騰訊云還在不斷“闖關(guān)升級”,但可以肯定的是,未來在千萬個具備匠人精神的“沙開波”努力下,騰訊云將會更茁壯,為用戶帶來更多的價值。
【免責(zé)聲明】本文僅代表作者本人觀點,與CTI論壇無關(guān)。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔(dān)全部責(zé)任。

專題

    <dfn id="ahnai"><pre id="ahnai"></pre></dfn>
    <thead id="ahnai"><meter id="ahnai"><label id="ahnai"></label></meter></thead>
    <samp id="ahnai"><input id="ahnai"><acronym id="ahnai"></acronym></input></samp>
  • <var id="ahnai"></var>
  • <rt id="ahnai"><input id="ahnai"><ul id="ahnai"></ul></input></rt>