來源:IT168 老魚/文
導語:“不服跑個分?”是一個老梗了。雖然,我們不能盲目崇信跑分,但跑分的確是一種比較直觀反映軟硬件性能的方式。不過,相比手機跑個分,數(shù)據(jù)庫性能測試卻要復雜的多……
最近,一家小公司顛覆了我們的認知!它完整的通過數(shù)據(jù)庫界最難的一個測試標準TPC-DS,說是登頂了數(shù)據(jù)庫領域的最高峰,并不為過,因為,此前的12年里,全球還沒有任何一家公司成功過。
5月3日,這家公司還在自家的用戶大會上發(fā)布了一系列創(chuàng)新產品:人工智能平臺智子;一站式大數(shù)據(jù)平臺產品:TDH6.0,分布式圖數(shù)據(jù)庫StellarDB,分布式閃存數(shù)據(jù)庫ArgoDB;大數(shù)據(jù)云平臺產品Data Cloud。
這家公司叫“星環(huán)科技”,創(chuàng)始人團隊均出自Intel,或許Intel都不曾想到,五年前被砍掉的一個項目,居然成就了今天這個估值超過20億,年營收超過2個億,騰訊都搶著投錢下注的公司。
TPC測試委員會主席Raghu
我們首先回顧下事情的經過,5月3日,全球知名的數(shù)據(jù)管理系統(tǒng)評測基準標準化組織TPC宣布,星環(huán)TDH平臺成為全球首個經過TPC官方審核的TPC-DS基準測試的數(shù)據(jù)平臺,打破了該領域十二年來沒有公司通過該項測試的局面,在世界范圍內填補了該項技術的空白。
該基準測試使用思科UCS集成基礎架構用于大數(shù)據(jù)和分析以及Transwarp Data Hub v5.1。
也許很多人不清楚TPC是個什么組織,TPC-DS是個什么測試,我們先行腦補。
眾所周知,用戶在選用平臺時,面對的是一個繽紛繁雜的世界。用戶希望有一種度量標準,能夠量化計算機系統(tǒng)的性能,以此作為選型的依據(jù)。因此,誕生了眾多標準化組織,而TPC就是其中之一。
TPC (事務性能管理委員會)是目前全球最知名的數(shù)據(jù)管理系統(tǒng)評測基準標準化組織。它的功能是制定商務應用基準程序(Benchmark)的標準規(guī)范、性能和價格度量,并管理測試結果的發(fā)布。
在過去二十多年間,該機構發(fā)布了多項數(shù)據(jù)庫評測基準,如TPC-A、TPC-D、TPC-H和TPC-DS,在業(yè)界得到了廣泛應用,相對而言,TPC在學術界和工業(yè)界擁有更強的影響力。
TPC-DS最早是用來衡量數(shù)據(jù)庫分析性能的基準測試。它是2006年在第32屆VLDB數(shù)據(jù)庫會議上提出,有99個測試。但基準測試不僅僅涉及這些查詢。測試過程和指標包括以下六個步驟(更多詳細信息,請參閱TPC-DS規(guī)范):
數(shù)據(jù)負載測試(LD)。
功耗測試(PT),在一個流中運行99個查詢。
吞吐量測試1(TT1),它在多個流中運行99個查詢。
維護測試1(DM1),它使用刷新功能更新數(shù)據(jù)庫。
吞吐量測試2(TT2),在多個流中重新運行99個查詢。
維護測試(DM2),使用刷新功能重新更新數(shù)據(jù)庫。
這99個查詢被定義為模板。每個查詢都有幾個參數(shù),這些參數(shù)由dsqgen和SEED確定,具體為“被選為用格式mmddhhmmsss”表示的數(shù)據(jù)庫加載時間結束時間(加載結束時間)的時間戳。這個時間戳“保證查詢替換參數(shù)值在運行之前是未知的”。除參數(shù)外,不同流的查詢順序也不相同。圖1顯示了執(zhí)行順序。
TPC-DS的性能結果取決于每個步驟的時間(生成SQL的時間不是結果的一部分)。根據(jù)TPC-DS測試流程,SQL語法和事務支持,優(yōu)化,穩(wěn)定性和可伸縮性被確定為DBMS的關鍵因素。
自從這個標準提出到今天,12年來,一直沒有一個產品能通過。因此,被視為數(shù)據(jù)庫界最難的一個測試標準,每隔一兩年都會在數(shù)據(jù)庫頂級會議上被討論,但遺憾的是一直沒有人能通過。
而TPC-DS測試模擬場景的數(shù)據(jù)量都比較大,一般10TB起步,傳統(tǒng)數(shù)據(jù)庫廠商多年都未通過,如IBM、Oracle、Teradata都曾做過嘗試,但并沒有成功。而大數(shù)據(jù)庫廠商出現(xiàn)以后,為了衡量SQL和Hadoop誰更好,從 2014年開始,主流Hadoop廠商(如Cloudera, Hortonworks,Databricks)也開始試圖攻破這一難題,每年都會去測上一次,也依然沒有取得什么實質進展。
星環(huán)科技創(chuàng)始人、董事長孫元浩在接受筆者采訪時表示:“我們參與測試的目的,并不是為了測試而測試,最初,我們的目的只是為了衡量我們的產品處于什么樣的水平階段,同時看看能不能通過測試。”
孫元浩說:“實際上,我們在2014年底就通過了第一階段測試,而后面的步驟花了三年多的時間,去年7月,我們把測試結果提交給TPC組織,他們花了五個月的時間去審計結果。審計完以后再把所有測試結果和過程的全部公開在網(wǎng)上,接受質疑,所以它的難度是非常高的。”
目前,國外廠商對TPC-DS的攻關還處在第一階段,孫元浩補充道。
由于SQL或事務支持限制,大多數(shù)基于Hadoop的廠商無法運行完整的TPC-DS基準測試。由于架構和優(yōu)化限制,傳統(tǒng)數(shù)據(jù)庫廠商難以通過測試或無法取得良好結果,尤其是在大數(shù)據(jù)環(huán)境下,比如傳統(tǒng)數(shù)據(jù)庫由于架構限制,當有大量數(shù)據(jù)交換時,會導致單個節(jié)點瓶頸。為了降低影響,一些廠商會引入了特殊設備來處理數(shù)據(jù)交換,這使得系統(tǒng)的成本很高。
而星環(huán)能通過完整測試,毫無疑問的證明,在某些領域星環(huán)已經超越國外廠商了,技術的差距總體來說已經很小了,甚至在某些方面已經超過了國外廠商。
榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報生成中...