亚洲综合社区欧美综合色-欧美逼逼一区二区三区-国产老熟女高潮精品网站-国产日韩最新视频在线看

始創(chuàng)于2000年 股票代碼:831685
咨詢熱線:0371-60135900 注冊有禮 登錄
  • 掛牌上市企業(yè)
  • 60秒人工響應(yīng)
  • 99.99%連通率
  • 7*24h人工
  • 故障100倍補償
全部產(chǎn)品
您的位置: 網(wǎng)站首頁 > 幫助中心>文章內(nèi)容

Excel訪問Hadoop 微軟意在鞏固Office

發(fā)布時間:  2012/7/27 14:17:14

      大數(shù)據(jù)的泡沫在毫無止境的膨脹,它給IT企業(yè)帶來了顛覆性的改革。 Hortonworks的CEO Eric Baldeschwieler表示,目前企業(yè)中80%的數(shù)據(jù)是非結(jié)構(gòu)化數(shù)據(jù)。更為雷人的是這些數(shù)據(jù)在以60%的速度呈現(xiàn)指數(shù)級增長,到2020年,全球數(shù)據(jù)使用量預(yù)計將暴增44倍,達到35.2ZB(1ZB=10億TB)。大數(shù)據(jù)的急劇蔓延使得企業(yè)在存儲架構(gòu)方面逐漸面臨著史無前例的考驗,由此引發(fā)了數(shù)據(jù)倉庫、數(shù)據(jù)挖掘、商業(yè)智能、云計算等應(yīng)用的一連串連鎖反應(yīng)。

  據(jù)最新消息,微軟正在研發(fā)一種連接器,即Excel用戶能訪問Hadoop大數(shù)據(jù)處理結(jié)果。而Hortonworks希望把它變成NoSQL到SQL的的通用連接器,在開源社區(qū)推而廣之。

  大數(shù)據(jù)膨脹催生了微軟等巨頭紛紛擁抱Hadoop

  各大企業(yè)巨頭紛紛有所行動,雅虎、AOL、谷歌、Facebook等早期采用并使用Hadoop來存儲和分析PB級別的非結(jié)構(gòu)化數(shù)據(jù)。IBM也在在 SmartCloud 平臺上新增基于 Apache Hadoop 的服務(wù) InfoSphere BigInsights 分析軟件。Oracle的Big Data機采用了NoSQL數(shù)據(jù)庫和Hadoop框架。EMC也推出了世界上第一個定制的、高性能的Hadoop專用數(shù)據(jù)協(xié)同處理設(shè)備——Greenplum HD數(shù)據(jù)計算設(shè)備。Google 的網(wǎng)絡(luò)搜索引擎在得益于算法發(fā)揮作用的同時,Hadoop的核心MapReduce 在后臺發(fā)揮了極大的作用。億貝的Hadoop系統(tǒng)能夠很好地處理大規(guī)模非結(jié)構(gòu)化數(shù)據(jù),高效處理用戶郵件數(shù)據(jù)。

Hadoop核心框架MapReduce工作原理

  與各大巨頭相比,微軟更是耐不住寂寞,它與Hortonworks達成合作,致力于將Hadoop打造成用于存儲和處理數(shù)據(jù)的引人注目的平臺。Windows和Hadoop的結(jié)合將是非常具有吸引力的,這將吸引大量的Windows用戶。顯然微軟具有在此領(lǐng)域競爭的實力,優(yōu)化和調(diào)整是確保其成功的重要因素。

 

  微軟捷足先登 不斷強化開源Hadoop框架的支持

  大數(shù)據(jù)的浪潮一浪高過一浪,企業(yè)廝殺角逐越發(fā)激烈,微軟邁出的步伐似乎更快,發(fā)力更猛。Hadoop可謂是開源創(chuàng)新領(lǐng)域的杰出典范,微軟對Hadoop的支持更應(yīng)該被看作極具轉(zhuǎn)折式的決策。

  首先,早在2006年起微軟就捷足先登,致力于研發(fā)某種非常類似于Hadoop的項目,被稱為“Dryad”。

  2011年年初,該計劃通過與SQL Server和Windows Azure云的集成實現(xiàn)了Dryad的產(chǎn)品化。雖然現(xiàn)在微軟還沒有更新,但看上去Dryad似乎將成為在SQL Server平臺上影響大數(shù)據(jù)愛好者的有力競爭者。

  其次,微軟早在2011年3月份就發(fā)布了數(shù)據(jù)庫系統(tǒng)Trinity. Trinity是一款NoSQL數(shù)據(jù)庫,同時也是一個基于內(nèi)存的數(shù)據(jù)存儲與運算系統(tǒng)。Trinity包括一個圖結(jié)構(gòu)數(shù)據(jù)庫(提供實時查詢與后臺批量計算任務(wù),類似于Map/Reduce,同時支持ACI的事物并提供C#的客戶端API)和一個并行計算系統(tǒng)。目前在微軟為Probase和AEther這兩個產(chǎn)品服務(wù)。

  此外,2011年8月微軟就增加了SQL Server在大規(guī)模數(shù)據(jù)處理和并行數(shù)據(jù)倉庫平臺對開源Hadoop框架的支持。微軟已經(jīng)將Hadoop嵌入到了生態(tài)系統(tǒng)中,并且發(fā)布了SQL Server的Hadoop連接器,此外,還推出了基于Hadoop的Windows Azure預(yù)覽版,該連接器的最終版本已提供下載。這兩個連接器采用SQL to Hadoop (SQOOP)技術(shù),在Hadoop File System (HDFS)和微軟關(guān)系數(shù)據(jù)庫之間有效地傳輸數(shù)據(jù)。通過這個連接器,用戶可以在Hadoop中分析非結(jié)構(gòu)化數(shù)據(jù),然后遷移到SQL Server環(huán)境中進行數(shù)據(jù)分析。

SQL Server的Hadoop連接器

  用戶需要將SQL Server Hadoop連接器部署到Hadoop集群的主節(jié)點上。主節(jié)點還需要安裝Sqoop和微軟的Java數(shù)據(jù)庫連接驅(qū)動。Sqoop是一個開源命令行工具,用來從關(guān)系型數(shù)據(jù)庫導(dǎo)入數(shù)據(jù),并使用Hadoop MapReduce框架進行數(shù)據(jù)轉(zhuǎn)換,然后將數(shù)據(jù)重新導(dǎo)回數(shù)據(jù)庫當中。

  當SQL Server Hadoop連接器部署完畢之后,用戶可以使用Sqoop來導(dǎo)入導(dǎo)出SQL Server數(shù)據(jù)。注意,Sqoop和連接器是在一個Hadoop的集中視圖下進行操作的,這意味著用戶使用Sqoop導(dǎo)入數(shù)據(jù)的時候是從SQL Server數(shù)據(jù)庫檢索數(shù)據(jù)并添加到Hadoop環(huán)境中,而相反地,導(dǎo)出數(shù)據(jù)是指從Hadoop中檢索數(shù)據(jù)并發(fā)送到SQL Server數(shù)據(jù)庫當中。

  總而言之,微軟表示,隨著新連接工具的出現(xiàn),客戶將能夠在Hadoop、SQL Server和并行數(shù)據(jù)倉換環(huán)境下相互交換數(shù)據(jù)。

  微軟再次發(fā)力在線數(shù)據(jù)庫連接器:Apache Hadoop發(fā)揚光大

  微軟新研發(fā)的是一款ODBC連接器,用于訪問Hadoop對應(yīng)的Hive數(shù)據(jù)倉庫系統(tǒng)。Excel用戶拿到Hive數(shù)據(jù)后,就可以借助Excel PowerPivot等工具,開始數(shù)據(jù)分析了。

Hortonworks與微軟積極開展合作,致力于將微軟的Hadoop連接器推廣到開源社區(qū)。另外的JavaScript也遵循同樣的模式,即微軟關(guān)注的是做產(chǎn)品,而Hortonworks則致力于開源。

  Hortonworks借微軟東風(fēng) 強化合作

  雖然目前來講,這款Javascript框架和連接器還沒有發(fā)布,不過預(yù)計將來會開源,前景很客觀。

  總之,“閉源”微軟擁抱Hadoop是木已成舟,微軟似乎對開源領(lǐng)域頻繁拋出橄欖枝,但無論如何,微軟都不可能與開源Linux劃上等號,因為Linux永遠是Windows系統(tǒng)在臺式機及服務(wù)器領(lǐng)域的直接對手。而Hadoop則不同,它可以作為微軟SQL Server及Azure系列產(chǎn)品的一大重要補充方案而存在。另一方面,Hortonworks 希望能夠與微軟積極合作,將這門技術(shù)應(yīng)用到開源領(lǐng)域,被廣大Apache Hadoop社區(qū)所采用。微軟將重點研發(fā)這款工具,打造屬于自己產(chǎn)品的核心平臺,正所謂各取所需,Hortonworks 也將重點瞄準了產(chǎn)品,希望借此東風(fēng),進一步衍生出更廣泛的應(yīng)用。


本文出自:億恩科技【m.1tcdy.com】

服務(wù)器租用/服務(wù)器托管中國五強!虛擬主機域名注冊頂級提供商!15年品質(zhì)保障!--億恩科技[ENKJ.COM]

  • 您可能在找
  • 億恩北京公司:
  • 經(jīng)營性ICP/ISP證:京B2-20150015
  • 億恩鄭州公司:
  • 經(jīng)營性ICP/ISP/IDC證:豫B1.B2-20060070
  • 億恩南昌公司:
  • 經(jīng)營性ICP/ISP證:贛B2-20080012
  • 服務(wù)器/云主機 24小時售后服務(wù)電話:0371-60135900
  • 虛擬主機/智能建站 24小時售后服務(wù)電話:0371-60135900
  • 專注服務(wù)器托管17年
    掃掃關(guān)注-微信公眾號
    0371-60135900
    Copyright© 1999-2019 ENKJ All Rights Reserved 億恩科技 版權(quán)所有  地址:鄭州市高新區(qū)翠竹街1號總部企業(yè)基地億恩大廈  法律顧問:河南亞太人律師事務(wù)所郝建鋒、杜慧月律師   京公網(wǎng)安備41019702002023號
      0
     
     
     
     

    0371-60135900
    7*24小時客服服務(wù)熱線