精准猎取科技资讯,天堂视频在线观看,高效阅读科技新闻_黄色av网站在线免费观看_科技猎

數據太大?你該了解Hadoop分布式文件系統

我是創始人李巖:很抱歉!給自己產品做個廣告,點擊進來看看。  

數據太大?你該了解Hadoop分布式文件系統

作者:魯暢

大數據時代來了。當所有人都爭吵著這件事情的時候,當所有企業都看好大數據的發展前景的時候,卻都很少關注這些數據從哪兒來,我們有沒有足夠優秀的技術能力處理這些數據。

聯網設備增加 數據量隨之上升

網絡的發展無疑為我們迎接大數據時代、智能計算時代鋪好了路。根據研究公司的預測,全球聯網設備正在增加,在部分國家,人均聯網設備早已超過2臺;如此大量的聯網設備和不斷提高的網絡速度都在讓社會的數據量快速增長,智慧城市、平安城市的實現也是以視頻監控等視頻數據為基礎,成為大數據時代的重要組成部分。

數據太大?你該了解Hadoop分布式文件系統

機器人、AI、機器學習的研究讓數據成為未來輔助我們生活的必要因素,無人車、機器人快遞等形式的出現, 一方面體現了數據價值,另一方面也是在不斷收集數據,反哺數據分析和應用。

數據體量太大 誰來處理?

數據產生后,意味著數據的采集工作已經完成,那么數據的輸入與有效輸出問題怎么破解?

自大數據時代到來之后,分布式存儲、大文件的讀寫都成為熱點話題,如何應對越來越多的大文件存儲、分析與檢索,成為企業需要攻克的難題。

數據太大?你該了解Hadoop分布式文件系統

而Hadoop的原型要從2002年開始說起。Hadoop的雛形始于2002年的Apache的Nutch,Nutch是一個開源Java 實現的搜索引擎。而后根據谷歌發表的學術淪為谷歌文件系統(GFS),實現了分布式文件存儲系統名為NDFS。而后又根據Google發表的一篇技術學術論文MapReduce,在Nutch搜索引擎實現了用于大規模數據集(大于1TB)的并行分析運算。最后,雅虎雇用了Doug Cutting,Doug Cutting將NDFS和MapReduce升級命名為Hadoop,HDFS(Hadoop Distributed File System,Hadoop分布式文件系統)就此形成。

應該說Hadoop是針對大數據而存在的,HDFS能夠提供高吞吐量的數據訪問,適合有著超大規模數據集的應用程序。我們可以在Hadoop的設計中看到三大特點:適用于存儲超大文件、適合運行在普通廉價的服務器上,同時,最搞笑的訪問模式是一次寫入、多次讀取。

數據太大?你該了解Hadoop分布式文件系統

當然,HDFS也存在一些弊端,比如說不適用于有低延遲要求的應用場景。因為Hadoop是針對大數據傳輸的存在,是為高數據吞吐量應用而設計,這導致其必然要以高延遲作為代價。同時HDFS分布式存儲不適用于小文件傳輸,在大量小文件傳輸過程中,namenode的內存就吃不消了。

2、Hadoop概念科普

Hadoop概念科普

在了解了Hadoop的身世和現在適合的應用場景之后,筆者要跟大家科普一下Hadoop的基礎架構和主要概念。

NameNode: namenode負責管理文件目錄、文件和block的對應關系以及block和datanode的對應關系。這是由唯一一臺主機專門保存,當然這臺主機如果出錯,NameNode就失效了,需要啟動備用主機運行NameNode。

DataNode: 負責存儲,當然大部分容錯機制都是在datanode上實現的。分布在廉價的計算機上,用于存儲Block塊文件。

MapReduce: 通俗說MapReduce是一套從海量·源數據提取分析元素最后返回結果集的編程模型,將文件分布式存儲到硬盤是第一步,而從海量數據中提取分析我們需要的內容就是MapReduce做的事了。

Block: 也叫作數據塊,默認大小為64MB。每一個block會在多個datanode上存儲多份副本,默認是3份。

Rack: 機柜,一個block的三個副本通常會保存到兩個或者兩個以上的機柜中。

End.

本文被轉載1次

首發媒體 36大數據 | 轉發媒體

隨意打賞

hadoop數據分析大數據hadoop分布式文件系統
提交建議
微信掃一掃,分享給好友吧。
主站蜘蛛池模板: 检验科改造施工_DSA手术室净化_导管室装修_成都特殊科室建设厂家_医疗净化工程公司_四川华锐 | 集装箱标准养护室-集装箱移动式养护室-广州璟业试验仪器有限公司 | LED灯杆屏_LED广告机_户外LED广告机_智慧灯杆_智慧路灯-太龙智显科技(深圳)有限公司 | 仓储笼_仓储货架_南京货架_仓储货架厂家_南京货架价格低-南京一品仓储设备制造公司 | sus630/303cu不锈钢棒,440C/430F/17-4ph不锈钢研磨棒-江苏德镍金属科技有限公司 | 湖南印刷厂|长沙印刷公司|画册印刷|挂历印刷|台历印刷|杂志印刷-乐成印刷 | 天津市能谱科技有限公司-专业的红外光谱仪_红外测油仪_紫外测油仪_红外制样附件_傅里叶红外光谱技术生产服务厂商 | 广州展台特装搭建商|特装展位设计搭建|展会特装搭建|特装展台制作设计|展览特装公司 | 医用酒精_84消毒液_碘伏消毒液等医用消毒液-漓峰消毒官网 | 聚合甘油__盐城市飞龙油脂有限公司| 废气处理设备-工业除尘器-RTO-RCO-蓄热式焚烧炉厂家-江苏天达环保设备有限公司 | 捷码低代码平台 - 3D数字孪生_大数据可视化开发平台「免费体验」 | 高低温试验房-深圳高低温湿热箱-小型高低温冲击试验箱-爱佩试验设备 | 产业规划_产业园区规划-产业投资选址及规划招商托管一体化服务商-中机院产业园区规划网 | 对辊破碎机_四辊破碎机_双齿辊破碎机_华盛铭重工| 塑胶跑道施工-硅pu篮球场施工-塑胶网球场建造-丙烯酸球场材料厂家-奥茵 | 磁力链接搜索神器_BT磁力狗_CILIMAO磁力猫_高效磁力搜索引擎2024 | 福兰德PVC地板|PVC塑胶地板|PVC运动地板|PVC商用地板-中国弹性地板系统专业解决方案领先供应商! 福建成考网-福建成人高考网 | 欧美日韩国产一区二区三区不_久久久久国产精品无码不卡_亚洲欧洲美洲无码精品AV_精品一区美女视频_日韩黄色性爱一级视频_日本五十路人妻斩_国产99视频免费精品是看4_亚洲中文字幕无码一二三四区_国产小萍萍挤奶喷奶水_亚洲另类精品无码在线一区 | wika威卡压力表-wika压力变送器-德国wika代理-威卡总代-北京博朗宁科技 | 美缝剂_美缝剂厂家_美缝剂加盟-地老板高端瓷砖美缝剂 | 小型手持气象站-空气负氧离子监测站-多要素微气象传感器-山东天合环境科技有限公司 | 都江堰招聘网-都江堰人才网 都江堰人事人才网 都江堰人才招聘网 邢台人才网_邢台招聘网_邢台123招聘【智达人才网】 | 篮球架_乒乓球台_足球门_校园_竞技体育器材_厂家_价格-沧州浩然体育器材有限公司 | 超声波清洗机_超声波清洗机设备_超声波清洗机厂家_鼎泰恒胜 | 防水套管厂家-柔性防水套管-不锈钢|刚性防水套管-天翔管道 | 球磨机,节能球磨机价格,水泥球磨机厂家,粉煤灰球磨机-吉宏机械制造有限公司 | [官网]叛逆孩子管教_戒网瘾学校_全封闭问题青少年素质教育_新起点青少年特训学校 | 隧道烘箱_隧道烘箱生产厂家-上海冠顶专业生产烘道设备 | 切铝机-数控切割机-型材切割机-铝型材切割机-【昆山邓氏精密机械有限公司】 | 深圳法律咨询【24小时在线】深圳律师咨询免费 | 安徽千住锡膏_安徽阿尔法锡膏锡条_安徽唯特偶锡膏_卡夫特胶水-芜湖荣亮电子科技有限公司 | 大型低温冷却液循环泵-低温水槽冷阱「厂家品牌」京华仪器_京华仪器 | 东莞猎头公司_深圳猎头公司_广州猎头公司-广东万诚猎头提供企业中高端人才招聘服务 | 兰州牛肉面加盟,兰州牛肉拉面加盟-京穆兰牛肉面 | 皮带式输送机械|链板式输送机|不锈钢输送机|网带输送机械设备——青岛鸿儒机械有限公司 | 铸铝门厂家,别墅大门庭院大门,别墅铸铝门铜门[十大品牌厂家]军强门业 | 包装机_厂家_价格-山东包装机有限公司 | 阁楼货架_阁楼平台_仓库仓储设备_重型货架_广州金铁牛货架厂 | 大型多片锯,圆木多片锯,方木多片锯,板材多片锯-祥富机械有限公司 | 能耗监测系统-节能监测系统-能源管理系统-三水智能化 |