没有找到合适的产品?
联系客服协助选型:023-68661681
提供3000多款全球软件/控件产品
针对软件研发的各个阶段提供专业培训与技术咨询
根据客户需求提供定制化的软件开发服务
全球知名设计软件,显著提升设计质量
打造以经营为中心,实现生产过程透明化管理
帮助企业合理产能分配,提高资源利用率
快速打造数字化生产线,实现全流程追溯
生产过程精准追溯,满足企业合规要求
以六西格玛为理论基础,实现产品质量全数字化管理
通过大屏电子看板,实现车间透明化管理
对设备进行全生命周期管理,提高设备综合利用率
实现设备数据的实时采集与监控
利用数字化技术提升油气勘探的效率和成功率
钻井计划优化、实时监控和风险评估
提供业务洞察与决策支持实现数据驱动决策
原创|行业资讯|编辑:况鱼杰|2020-06-03 10:13:33.943|阅读 312 次
概述:Apache Hadoop Ozone是一个分布式键值存储,可以同时管理大小文件。Ozone旨在解决HDFS相对于小文件的规模限制。HDFS旨在存储大文件,对于Namenode,HDFS上建议的文件数量为3亿个,并且扩展规模不能超过此限制。
# 界面/图表报表/文档/IDE等千款热门软控件火热销售中 >>
相关链接:
Apache Hadoop Ozone是一个分布式键值存储,可以同时管理大小文件。Ozone旨在解决HDFS相对于小文件的规模限制。HDFS旨在存储大文件,对于Namenode,HDFS上建议的文件数量为3亿个,并且扩展规模不能超过此限制。
有助于实现可扩展性的Ozone的主要功能是:
突破10亿个密钥之旅,超越了HDFS可扩展性限制
在Ozone中达到十亿个对象一直是该项目的重要里程碑之一。使用在5个节点(每个节点有50个线程)上运行的自定义作业填充数据。Ozone在11个节点的群集(1个OM,1个SCM和9个数据节点)上运行,花了56个小时才达到10亿个对象,每个对象的大小均为10KB。选择10KB的原因是用小文件测量Ozone性能。
Ozone能够以〜5000个对象/秒的持续速率写入对象,这进一步突出了Ozone的小文件处理能力,在整个测试过程中,它能够提供相同的吞吐量。
一些重要的细节:
来自OzoneManger的持续交易
OzoneManger总共处理了20亿笔交易,每个对象有两笔交易(一个用于打开文件,另一个用于提交文件)。OzoneManger(OM)以大约12毫秒的延迟处理了10亿个对象中的这些操作。恒定的等待时间还凸显了OzoneManager上没有长时间的GC暂停。
小元数据开销
每个10KB大小的十亿个密钥存储在2121个5GB容器中,这大大减少了SCM的块元数据,与在OFS中报告的2121个容器相比,HDFS中报告了10亿个块。另一方面,OM上的十亿个密钥在SSD上总共占用了127 GB的空间。
测试环境
该测试在Apache Hadoop Ozone 0.5.0(Beta)版本上运行。
硬件
该测试是在AWS EC2实例类型为m5a.4xlarge的情况下执行的,其中具有用于OzoneManager和Storage Container Manager数据库的SSD。
结论
HDFS围绕小文件的已知限制和名称空间规模限制导致存储节点利用率不足,GC问题和Namenode不稳定,以及大型数据湖部署的名称空间碎片。Ozone通过处理数十亿个各种大小的文件来克服这些限制,因此可以在单个名称空间中部署大型数据湖。 具有更高规模的Ozone体系结构以及对对象存储用例的支持,可以满足私有云环境中对大数据存储的需求,在私有云环境中,计算和存储的分类正在迅速发展。
关于Cloudera
在 Cloudera,我们相信数据可以使今天的不可能,在明天成为可能。我们使人们能够将复杂的数据转换为清晰而可行的洞察力。Cloudera 为任何地方的任何数据从边缘到人工智能提供企业数据云平台服务。在开源社区不懈创新的支持下, Cloudera推动了全球最大型企业的数字化转型历程。了解更多,请联系。
慧都大数据专业团队为企业提供Cloudera大数据平台搭建,免费业务咨询,定制开发等完整服务,快速、轻松、低成本将任何Hadoop集群从试用阶段转移到生产阶段。
欢迎拨打慧都热线023-68661681或咨询慧都在线客服,我们有专业的大数据团队,为您提供免费大数据相关业务咨询!
本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@atlvshi.cn
本文将介绍如何利用 Spire.Doc for Java 在 Java 项目中实现从 Word 文档中提取表格。
本文将深入解析 Aspose.Word 的技术优势,探讨它如何为现代开发场景提供创新的解决方案。
本文探讨了数字体验在业务成功中的关键作用,强调了通过优化应用性能、API质量和开发者体验来提升用户忠诚度和业务增长的重要性,欢迎查阅~
JetBrains 官方推出的微信小程序插件为开发者提供了强大的支持,简化了 WXML、WXSS 和 WXS 的语法编辑。通过 WebStorm,开发者可以高效地进行小程序开发,同时享受更高的代码提示与自动补全功能,极大提升开发效率。
一款用于数据驱动的云优先型企业的平台。
Cloudera Data Warehouse今天,明天及未来的现代分析数据库。
Cloudera DataFlowCloudera DataFlow是一个可扩展的实时流分析平台。
Cloudera Machine Learning使AI第一企业能够通过自助服务访问受控数据。
CDP Data CenterCDP Data Center是用于本地IT环境的全面数据管理和分析平台。
服务电话
重庆/ 023-68661681
华东/ 13452821722
华南/ 18100878085
华北/ 17347785263
客户支持
技术支持咨询服务
服务热线:400-700-1020
邮箱:sales@atlvshi.cn
关注我们
地址 : 重庆市九龙坡区火炬大道69号6幢