问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501
你好,欢迎来到懂视!登录注册
当前位置: 首页 - 正文

大数据和云计算关系

发布网友 发布时间:2022-04-23 16:35

我来回答

1个回答

热心网友 时间:2022-04-09 17:18

大数据和云计算关系
关于大数据和云计算的关系人们通常会有误解。而且也会把它们混起来说,分别做一句话直白解释就是:云计算就是硬件资源的虚拟化;大数据就是海量数据的高效处理。
  虽然上面的一句话解释不是非常的贴切,但是可以帮助你简单的理解二者的区别。另外,如果做一个更形象的解释,云计算相当于我们的计算机和操作系统,将大量的硬件资源虚拟化之后再进行分配使用,在云计算领域目前的老大应该算是Amazon,可以说为云计算提供了商业化的标准,另外值得关注的还有VMware(其实从这一点可以帮助你理解云计算和虚拟化的关系),开源的云平台最有活力的就是Openstack了;
  大数据相当于海量数据的“数据库”,而且通观大数据领域的发展也能看出,当前的大数据处理一直在向着近似于传统数据库体验的方向发展,Hadoop的产生使我们能够用普通机器建立稳定的处理TB级数据的集群,把传统而昂贵的并行计算等概念一下就拉到了我们的面前,但是其不适合数据分析人员使用(因为MapRece开发复杂),所以PigLatin和Hive出现了(分别是Yahoo!和*发起的项目,说到这补充一下,在大数据领域Google、*、*等前沿的互联网公司作出了很积极和强大的贡献),为我们带来了类SQL的操作,到这里操作方式像SQL了,但是处理效率很慢,绝对和传统的数据库的处理效率有天壤之别,所以人们又在想怎样在大数据处理上不只是操作方式类SQL,而处理速度也能“类SQL”,Google为我们带来了Dremel/PowerDrill等技术,Cloudera(Hadoop商业化最强的公司,Hadoop之父cutting就在这里负责技术领导)的Impala也出现了。
  整体来看,未来的趋势是,云计算作为计算资源的底层,支撑着上层的大数据处理,而大数据的发展趋势是,实时交互式的查询效率和分析能力,借用Google一篇技术论文中的话,“动一下鼠标就可以在秒级操作PB级别的数据”难道不让人兴奋吗?(田原)

  在谈大数据的时候,首先谈到的就是大数据的4V特性,即类型复杂,海量,快速和价值。IBM原来谈大数据的时候谈3V,没有价值这个V。而实际我们来看4V更加恰当,价值才是大数据问题解决的最终目标,其它3V都是为价值目标服务。在有了4V的概念后,就很容易简化的来理解大数据的核心,即大数据的总体架构包括三层,数据存储,数据处理和数据分析。类型复杂和海量由数据存储层解决,快速和时效性要求由数据处理层解决,价值由数据分析层解决。
  数据先要通过存储层存储下来,然后根据数据需求和目标来建立相应的数据模型和数据分析指标体系对数据进行分析产生价值。而中间的时效性又通过中间数据处理层提供的强大的并行计算和分布式计算能力来完成。三层相互配合,让大数据最终产生价值。
  数据存储层
  数据有很多分法,有结构化,半结构化,非结构化;也有元数据,主数据,业务数据;还可以分为GIS,视频,文件,语音,业务交易类各种数据。传统的结构化数据库已经无法满足数据多样性的存储要求,因此在RDBMS基础上增加了两种类型,一种是hdfs可以直接应用于非结构化文件存储,一种是nosql类数据库,可以应用于结构化和半结构化数据存储。
  从存储层的搭建来说,关系型数据库,NoSQL数据库和hdfs分布式文件系统三种存储方式都需要。业务应用根据实际的情况选择不同的存储模式,但是为了业务的存储和读取方便性,我们可以对存储层进一步的封装,形成一个统一的共享存储服务层,简化这种操作。从用户来讲并不关心底层存储细节,只关心数据的存储和读取的方便性,通过共享数据存储层可以实现在存储上的应用和存储基础设置的彻底解耦。
  数据处理层
  数据处理层核心解决问题在于数据存储出现分布式后带来的数据处理上的复杂度,海量存储后带来了数据处理上的时效性要求,这些都是数据处理层要解决的问题。
  在传统的云相关技术架构上,可以将hive,pig和hadoop-maprece框架相关的技术内容全部划入到数据处理层的能力。原来我思考的是将hive划入到数据分析层能力不合适,因为hive重点还是在真正处理下的复杂查询的拆分,查询结果的重新聚合,而maprece本身又实现真正的分布式处理能力。
  maprece只是实现了一个分布式计算的框架和逻辑,而真正的分析需求的拆分,分析结果的汇总和合并还是需要hive层的能力整合。最终的目的很简单,即支持分布式架构下的时效性要求。
  数据分析层
  最后回到分析层,分析层重点是真正挖掘大数据的价值所在,而价值的挖掘核心又在于数据分析和挖掘。那么数据分析层核心仍然在于传统的BI分析的内容。包括数据的维度分析,数据的切片,数据的上钻和下钻,cube等。
  数据分析我只关注两个内容,一个就是传统数据仓库下的数据建模,在该数据模型下需要支持上面各种分析方法和分析策略;其次是根据业务目标和业务需求建立的KPI指标体系,对应指标体系的分析模型和分析方法。解决这两个问题基本解决数据分析的问题。
  传统的BI分析通过大量的ETL数据抽取和集中化,形成一个完整的数据仓库,而基于大数据的BI分析,可能并没有一个集中化的数据仓库,或者将数据仓库本身也是分布式的了,BI分析的基本方法和思路并没有变化,但是落地到执行的数据存储和数据处理方法却发生了大变化。
  谈了这么多,核心还是想说明大数据两大核心为云技术和BI,离开云技术大数据没有根基和落地可能,离开BI和价值,大数据又变化为舍本逐末,丢弃关键目标。简单总结就是大数据目标驱动是BI,大数据实施落地式云技术。
声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
E-MAIL:11247931@qq.com
初二选辅导书,新教材完全解读、中学教材全解和点拨哪个好 ...N系,还有三星、索尼、飞利浦,哪个MP3的音质最好 白本的近义词 白铜怎么造句 cc sc区别 ...都是怎么保存的?为什么越久越香,还不会变质? 我和女孩认识将近20天了,女孩只让我拉手,但得不到别的进展,求助? 对女的再怎么欲擒故纵,她也仍旧泰然自若,为什么?不爱还是心里强大? 女人只要沉住_,就_有什_你得不到的 如何关掉电脑低音炮 大数据和云计算之间是什么关系呢? 大数据与云计算之间的关系是 大数据与云计算之间的关系是怎样的 从技术上来看,大数据和云计算的关系是怎样的? 大数据和云计算有什么关系? 新员工入职培训管理包括哪些内容? 对于新员工,培训分为哪几个阶段 新员工培训怎么纳入绩效考核? 新员工培训效果怎么验证 新员工培训体系怎么设计好啊? 新人培训评价怎么写 笔记本NBA2K17玩了一半就自动关机 如何辨别纯粮酒呢? NBA2k17每次进去都是1080p 我电脑能玩nba2k17吗 玩2k17自动重启是什么原因,如何解决 nba2k17电脑版镜头聚焦高度调整 求教一下为什么我电脑玩2K17老是自动重启啊!急,求大神 nba2k17对电脑有什么要求 电脑玩2K17大型的游戏重启,开机只能按F1进BIOS 或者按 什么叫大数据,与云计算有何关系 为了免于抓错人,二战时德国纳粹是如何分辨犹太人? 世界大战,希特勒杀了很多犹太人,希特勒怎么知道某人就是犹太人呢。 二战时期德国人是怎么分辨出谁是犹太人的呢? 犹太人的身体特征 德国人怎么区分犹太人 犹太人和欧洲人人种特征有什么不同,如何快速区分? 犹太人外表有什么特征? 德国人是怎么分辨犹太人的 犹太人的特征有哪些呢? 犹太人的特点? 犹太人是什么样的人?怎么知道一个人是不是犹太人,有什么体貌特征么 犹太人有哪些特征? 犹太人有什么特点? 犹太人有什么明显的外貌特征吗?为什么当年纳粹可以马上分辨出他们呢? 犹太人种有什么特征?比如二战时,纳粹是怎辩认犹太人的。 olay天猫直播间在哪里 淘宝天猫超市的官方直播间在哪? 天猫直播在哪儿看?天猫直播观看地址介绍 天猫超市辣妈团直播在哪
  • 焦点

最新推荐

猜你喜欢

热门推荐