专业汉语词典知识平台,分享汉字词语知识、历史文学知识解答!

励北网
励北网

hadoop是什么(简述什么是hadoop)

来源:小易整编  作者:小易  发布时间:2023-03-23 11:08
摘要:大数据简介:大数据是指通过全球各种平台产生的所有数据。大数据类别:结构化的非结构化半结构化大数据示例:1)纽交所每天产生约1TB的新交易数据。2)社交媒体:统计数据显示,每天有超过500TB的数据被摄入社交媒体网站脸书的数据库。数据主要...

大数据简介:

hadoop是什么(简述什么是hadoop)

大数据是指通过全球各种平台产生的所有数据。

大数据类别:

结构化的非结构化半结构化

大数据示例:

1)纽交所每天产生约1TB的新交易数据。

2)社交媒体:统计数据显示,每天有超过500 TB的数据被摄入社交媒体网站脸书的数据库。

数据主要根据以下几个方面生成:

照片和视频上传信息交流注释

3)喷气发动机/旅游门户:

英格喷气发动机产生10tb(TB是每天飞行30分钟的数据)。数据生成量高达数Pb(千兆字节)。

什么是Hadoop?

Hadoop是由Apache软件基金会管理的开源框架。开源是指免费提供,其源代码可以根据用户的要求进行更改。Hadoop旨在有效存储和处理大数据。Hadoop用于数据存储、处理、分析、访问、治理、运营和安全。

Hadoop被拥有大量数据的大型组织所使用,它是在大型商业硬件集群的帮助下进行处理的。集群是一组通过LAN连接的系统,集群上的多个节点有助于执行Hadoop作业。Hadoop在管理大数据方面已经在全球范围内广受欢迎。目前拥有近90%的市场份额。

Hadoop的功能

经济高效:Hadoop系统非常经济高效,因为它不需要任何专用硬件,因此投资少。对于系统而言,使用称为商品硬件的简单硬件就足够了。支持大型节点集群:Hadoop结构可以由构成大型集群的数千个节点组成。大型集群有助于扩展存储系统并提供更多的计算能力。数据的并行处理:Hadoop系统支持跨集群中所有节点的数据并行处理,因此减少了存储和处理时间。数据分配(分布式处理):Hadoop可以在集群中的所有节点之间高效地分配数据。此外,如果特定节点正忙或无法运行,它会在整个群集上复制数据以便检索友优资源网其他节点的数据。自友优资源网动故障转移管理(容错):Hadoop的一个重要功能是,如果群集中的节点发生故障,它可以自动解决问题。框架本身将故障系统替换为另一个系统,并在新计算机上配置复制的设置和数据。支持异构群集:异构群集是一种用于说明来自不同供应商,不同操作系统,并在不同版本上运行的节点或计算机的群集。例如,如果Hadoop集群具有三个系统,一个在RHEL Linux上运行的Lenovo计算机,第二个是在Ubuntu Linux上运行的Intel计算机,第三个是在Fedora Linux上运行的AMD计算机,则所有这些不同的系统都能够同时运行在单个群集上运行。可伸缩性:Hadoop系统具有从群集中添加或删除节点/节点和硬件组件的能力,而不会影响群集的操作。这是指可扩展性,这是Hadoop系统的重要功能之一。

Hadoop生态系统概述

其中:

HDFS(Hadoop分布式文件系统)Apache MapReduceApache PigApache HBaseApache HiveApache SqoopApache FlumeApache ZookeeperApache kafkaApache Oo友优资源网zie

HDFS(Hadoop分布式文件系统):HDFS执行Hadoop框架中最重要的工作。它同时分发数据并将其存储在集群中的每个节点上。这个过程减少了在磁盘上存储数据的总时间。

MapReduce:Hadoop MapReduce是系统的另一个重要组成部分,负责处理集群中存储的大量数据。它允许并行处理存储在HDFS的所有数据。而且通过集群中的大规模可扩展性解决了处理成本高的问题。

Apache Pig (Pig是Hadoop生态系统的ETL):是一种高级脚本语言,用于为Hadoop集群中的大型数据集编写数据分析程序。Pig使开发人员能够生成查询执行例程来分析大型数据集。脚本语言叫猪拉丁,猪的关键部分,第二个关键部分是编译器。

Apache h base(OLTP/NoSQL)来源:是一个面向列的数据库,支持HDFS的实时运行。它可以处理大型数据库表,即具有数百万行和列的文件。HBase的一个重要用途是有效地使用主节点来管理区域服务器。

Apache Hive(Hive是Hadoop上的SQL引擎):通过一个类似SQL的接口,Hive允许对HDFS的数据进行平方处理。SQL的Hive版本称为HiveQL。

Apache Sqoop(从RDBMS [SQL source]向Hadoop导入/导出数据):它是一个可以帮助从Hadoop向其他关系数据库管理系统导入和导出数据的应用程序。它可以传输大量数据。Sqoop基于连接器架构,支持插件与新的外部系统建立连接。

Apache Flume(从非结构化数据(社交媒体网站)导入的数据)/内置在Hadoop中的数据):这是一个允许将流数据存储在Hadoop集群中的应用程序。例如,将数据写入日志文件就是流式数据的一个很好的例子。

Apache Zookeeper(集群环境下使用的协调工具):其作用是管理上述应用之间的协调,使其在Hadoop生态系统中高效运行。

Hadoop的功能——HDFS守护进程

Hadoop系统基于主从架构原理工作。

名称节点:是主节点,在实体中是单个的。它负责存储HDFS元数据,该元数据跟踪存储在HDFS的所有文件。元数据中存储的信息类似于文件名、文件的权限、文件的授权用户和文件的存储位置。这些信息存储在RAM中,通常称为文件系统元数据。

数据节点:是从节点,有多个编号。数据节点负责根据名称节点的指令存储和检索数据。数据节点会间歇性地向名称节点报告其当前状态以及存储的所有文件。一个节点存储每个文件的多个副本。

次名节点:次名节点的存在是为了支持主名节点存储元数据。当名称节点由于元数据损坏或任何其他原因出现故障时,辅助名称节点可以防止整个集群出现故障。

辅助名称节点指示名称节点创建并发送fsimage和editlog文件,然后辅助名称节点创建压缩的fsimage文件。然后,压缩文件被传输回tge name节点并被重命名。这个过程每小时重复一次,或者在editlog文件超过64MB时重复一次。


本文地址:百科常识频道 https://www.neebe.cn/changshi/937057.html,易企推百科一个免费的知识分享平台,本站部分文章来网络分享,本着互联网分享的精神,如有涉及到您的权益,请联系我们删除,谢谢!


百科常识
小编:小易整编
相关文章相关阅读
  • 暗黑3地狱火护符(暗黑3地狱火护符有什么用)

    暗黑3地狱火护符(暗黑3地狱火护符有什么用)

    臻品享受2023-05-01游戏3今天给各位分享暗黑3地狱火护符的知识,其中也会对暗黑3地狱火护符有什么用进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!switch暗黑3地狱火护符作用1、地狱火...

  • 想看比赛为何这么难(为什么一到比赛就很差)

    想看比赛为何这么难(为什么一到比赛就很差)

    一条龙2023-05-01体育3今天给各位分享想看比赛为何这么难的知识,其中也会对为什么一到比赛就很差进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!我喜欢足球,可是为什么看足球比赛时候,却不能?...

  • 张翰喜欢一个人要什么脸皮(张翰喜欢哪种女孩)

    张翰喜欢一个人要什么脸皮(张翰喜欢哪种女孩)

    好助手百科2023-05-01影视4本篇文章给大家谈谈张翰喜欢一个人要什么脸皮,以及张翰喜欢哪种女孩对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。走心机怎么样?1、好。建克走心机是一个专业的生产厂家,专注数控车...

  • 启东事件(启东事件为什么不报道)

    启东事件(启东事件为什么不报道)

    哈秀时尚2023-05-01财经3本篇文章给大家谈谈启东事件,以及启东事件为什么不报道对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。启东事件的事件起因事件起因:日本王子造纸在南通设立了造纸厂,但有大量污水需要排...

  • 歆(歆怎么读什么意思)

    歆(歆怎么读什么意思)

    推一把2023-05-01百科5今天给各位分享歆的知识,其中也会对歆怎么读什么意思进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!“歆”字读音是什么?“歆”的读音是xīn。有两种意思,第一种是喜爱...

  • 兼容性设置(兼容性设置卸载是什么意思)

    兼容性设置(兼容性设置卸载是什么意思)

    知道小编2023-05-01经验7今天给各位分享兼容性设置的知识,其中也会对兼容性设置卸载是什么意思进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!Win10系统兼容性怎么设置兼容模式开启方法1、...

  • 什么是pk(什么是pki,哪些部分组成)

    什么是pk(什么是pki,哪些部分组成)

    你好马冬梅2023-05-01知道3本篇文章给大家谈谈什么是pk,以及什么是pki,哪些部分组成对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。PK是什么意思/“PK”是指对决、挑战、杀死、末位淘汰等多种意思,该...

  • 自酿葡萄酒(自酿葡萄酒有什么功效与作用)

    自酿葡萄酒(自酿葡萄酒有什么功效与作用)

    知道小编2023-05-01美食3本篇文章给大家谈谈自酿葡萄酒,以及自酿葡萄酒有什么功效与作用对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。如何自酿葡萄酒酿葡萄酒的步骤如下:1、采摘葡萄后,葡萄被压碎以释放汁液...

  • 周排行
  • 月排行
  • 年排行

精彩推荐