问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501
你好,欢迎来到懂视!登录注册
当前位置: 首页 - 正文

2分钟读懂大数据框架Hadoop和Spark的异同

发布网友 发布时间:2022-04-30 01:50

我来回答

1个回答

热心网友 时间:2022-04-12 01:09

1、 Spark VSHadoop哪些异同点

Hadoop:布式批处理计算强调批处理用于数据挖掘、析

Spark:基于内存计算源集群计算系统目让数据析更加快速, Spark 种与 Hadoop 相似源集群计算环境两者间存些同处些用同处使 Spark 某些工作负载面表现更加优越换句说Spark 启用内存布数据集除能够提供交互式查询外优化迭代工作负载

Spark Scala 语言实现 Scala 用作其应用程序框架与 Hadoop 同Spark Scala 能够紧密集其 Scala 像操作本集合象轻松操作布式数据集

尽管创建 Spark 支持布式数据集迭代作业实际 Hadoop 补充 Hadoop 文件系统并行运行通名Mesos第三集群框架支持行Spark 由加州伯克利校 AMP 实验室 (Algorithms,Machines,and People Lab) 发用构建型、低延迟数据析应用程序

虽 Spark 与 Hadoop 相似处提供具用差异新集群计算框架首先Spark 集群计算特定类型工作负载设计即些并行操作间重用工作数据集(比机器习算)工作负载优化些类型工作负载Spark 引进内存集群计算概念内存集群计算数据集缓存内存缩短访问延迟.

数据处理面相信家hadoop已经耳熟能详基于GoogleMap/Rece实现Hadoop发者提供map、rece原语使并行批处理程序变非简单优美Spark提供数据集操作类型种像Hadoop提供MapRece两种操作比map,filter, flatMap,sample, groupByKey, receByKey, union,join, cogroup,mapValues, sort,partionBy等种操作类型些操作称Transformations同提供Count,collect, rece, lookup, save等种actions些种数据集操作类型给层应用者提供便各处理节点间通信模型再像Hadoop唯Data Shuffle种模式用户命名物化控制间结区等说编程模型比Hadoop更灵.

2、Spark容错性面否比其工具更优越性

Spark论文《Resilient Distributed Datasets: AFault-TolerantAbstraction for In-Memory Cluster Computing》没看容错性做倒提布式数据集计算做checkpoint两种式checkpoint dataloggingthe updates貌似Spark采用者文提虽者看似节省存储空间由于数据处理模型类似DAG操作程由于图某节点错由于lineage chains依赖复杂性能引起全部计算节点重新计算本低说存数据存更新志做checkpoint由用户说算吧相于都没说皮球踢给用户所我看由用户根据业务类型衡量存储数据IO磁盘空间代价重新计算代价选择代价较种策略取代给间结进行持久化或建立检查点Spark记住产某些数据集操作序列节点现故障Spark根据存储信息重新构造数据集认错其节点帮助重建

3、Spark于数据处理能力效率哪些特色

Spark提供高性能数据处理能力使用户快速反馈体验更另类应用做数据挖掘Spark充利用内存进行缓存利用DAG消除必要步骤所比较合适做迭代式运算相部机器习算通迭代收敛算所适合用Spark实现我些用算并行化用Spark实现R语言便调用降低用户进行数据挖掘习本

Spark配流数据处理模型与Twitter Storm框架相比Spark采用种趣且独特办Storm基本像放入独立事务管道其事务布式处理相反Spark采用模型收集事务短间内(我假设5秒)批处理式处理事件所收集数据自RDD使用Spark应用程序用组进行处理作者声称种模式缓慢节点故障情况更加稳健且5秒间间隔通于数应用已经足够快种统流式处理与非流式处理部

总结
几看Hadoop权威指南、hbase权威指南、hive权威指南、规模布式存储系统、zoopkeeper、数据互联网规模数据挖掘与布式处理等书同补充能静完整看完本书相错
声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
E-MAIL:11247931@qq.com
follow the doctor's advice为什么加's ...张娜拉的一首歌 我想学这首歌,把歌词转换成中文的,但是唱出来让人感... 我有一辆宝骏530车,外地牌子,在济南找工作带车,能干什么工作... 怎样判断小米路由器的指示灯是什么颜色的? 定期储蓄存单是什么 小型天文卫星携带仪器 公司给入了工伤保险保险公司问我要我的社保卡做什么可以吗? 出下列各种烷烃的结构简式(1)2,3,3-三甲基戊烷:___(2)2,3-二甲基-4... 我叫邢轲轲 女 英文怎么起个名字呢 类似kiki coco的英文名,哪些好? 交通银行太平洋信用卡和借记卡收到了,, 1.借记卡不激活,需要年费吗? 2.不激活借记卡,信用卡能用吗? 请问招商银行卡没开卡也没注销要收年费吗? 办理民生银行卡没有激活是否要收年费?谢谢高手告诉 铁路施工驻站和防护工作人员是甲方的还是乙方的? 进行接触网施工或维修作业时,设驻站联络员和现场防护人员的要求有哪些 新办的银行卡没有激活就不用交年费吗 既有线施工中,驻站联络员,防护员“ 五清楚,六必须”的答案是什么??? 手机微信收藏夹在什么位置 火车站 办理旅客乘降是什么 意思 微信收藏在手机的什么位置 辽宁沈阳蒙牛的驻(奶)站人员这工作怎么样啊 银行卡未激活是不是不收年费? 英大驻站服务员是什么 请问微信里的收藏是保存在哪里 ?(服务器还是本机) 银行卡未激活、未开通,会收年费吗? 驻站防护员的要求是什么? 地铁安检员驻站是啥意思 银行卡 没有开通 收年费吗(扣钱吗) 企业驻铁路火车站驻站员职责 铁路助站是干什么的 大数据hadoop和python哪个好 关于建国60周年爱国主义题材的演讲稿,演讲3分钟 爱祖国 爱党 演讲稿 3-4分钟左右 “我爱你中国”—庆祝建国60周年,弘扬爱国主义精神.为主题的演讲稿 庆祝祖国建国60周年演讲稿的开头 关于爱国的演讲稿1000字,跪求! 谢霆锋之前张柏芝还和陈晓东恋爱是真的吗? 谢霆锋翻唱BEYOND的光辉岁月是在哪哪年哪场演唱会? 谢霆锋粉丝团 陈晓东十宗罪 谢霆锋视频WMV 戴思聪的生病经过 张柏芝为什么会和谢霆峰复合? 王菲与谢霆锋现在怎么样了?女人如何才能像王菲一样永远有人爱? 如果陈晓东、谢霆锋和EDISON三人同时追张百芝,张百芝会选谁? 周讯哪里人,个人简历呢? 谢霆锋有哪些比较好看的电影??? 觉得《男儿本色》这部片子怎么样? 懂粤语的帮我个忙!!! 帮我翻译下图片上这个东东! 不动产权证到那里去办?
  • 焦点

最新推荐

猜你喜欢

热门推荐