回到顶部

【深圳站】大数据运维工程师——Hadoop管理员认证培训

2019年1月15日 9:00 ~ 2019年1月18日 17:00

收起

活动票种
    付费活动,请选择票种
    展开活动详情

    活动内容收起

    一、培训特色

    1.       标准的课程体系及原厂商认证的授课讲师

    与美国同步的原厂课程、经过层层考核的授课讲师,保证了我们的课程的规范化与标准化。大数据技术不同于其他学科技术,非常的新,发展也非常迅速,技术的迭代也使得我们的课程在不断更新。就目前来看,我们的课程涵盖的大数据运维、开发、分析方面,已处于市场领先地位。

    2.       课程设计合理

    知识体系层层递进,从基础开始逐渐深入,深入浅出授课,使学员更易于学习掌握。理论加实验的授课方式使课程更丰满。

    3.       重底层、讲原理

    为学员提供虚拟环境实战的同时,不放弃理论深度,以理论带动实际操作,使学员不仅仅只是一个纸上谈兵的理论者,更有动手的实力。

    二、培训目标

    为期4 天的Hadoop 管理员培训将帮助学员综合理解并全面掌握对Hadoop机群的运维管理,包括:安装,配置、负载平衡及性能调优等。通过该培训,Hadoop系统管理员将能准备好应对实际运维中遇到的挑战。

    通过讲师在课堂上的讲解,以及实操练习,学员将学习以下内容:管理机群的特性,譬如日志汇总、配置管理、报告、报警及服务管理。YARN、MapReduce、Spark及 HDFS的工作原理。如何为你的机群选取合适的硬件和架构。如何将 Hadoop 机群和企业已有的系统进行无缝集成。如何使用Flume 进行实时数据采集以及如何使用Sqoop在RDBMS和Hadoop机群之间进行数据导入导出。如何配置公平调度器为 Hadoop 上的多用户提供服务级别保障。产品环境中 Hadoop 机群的最佳运维实践。Hadoop 机群排错、诊断问题和性能调优。

    三、培训对象

    面向系统管理员和IT经理,需具备Linux 经验,无需Apache Hadoop 基础。

    四、培训证书

    培训结束并顺利通过考试后,颁发Cloudera全球认证证书,证书全球通用。

    证书可作为专业技术人员职业能力考核的证明,以及专业技术人员岗位聘用、任职、定级和晋升职务的重要依据。

    证书CCA131.jpg

    五、培训费用

    培训费7360元/人(含授课服务、授课教材、实验手册、培训期间虚拟机、税票费用)。

    考试费2500元/人(如不参加认证考试,无需缴纳考试费)。

    课程介绍

    名称

    Cloudera   Administrator Training for Apache Hadoop

    第一天上午

    Apache Hadoop 介绍    

    •  Hadoop 动机    

    •  基本概念    

    •  Hadoop 核心部件 

    Hadoop 机群安装    

    •  机群管理方案     

    •  Hadoop (CDH) 安装 

    Hadoop 分布式文件系统 (HDFS)    

    •  HDFS 特性    

    •  读写文件    

    •  NameNode 内存考虑    

    •  HDFS 安全简介   

    •  HDFS Web UI    

    •  使用 HDFS Shell 

    第一天下午

    Hadoop 分布式文件系统 (HDFS)    

    •  HDFS 特性    

    •  读写文件    

    •  NameNode 内存考虑    

    •  HDFS 安全简介   

    •  HDFS Web UI    

    •  使用 HDFS Shell 

    YARN 上的 MapReduce  Spark      

    •  计算平台在 Hadoop 里扮演的角色      

    •  YARN:机群资源管理器    

    •  MapReduce 概念    

    •  Apache Spark 概念    

    •  Yarn 上的计算平台    

    •  YARN Web UI  Shell    

    •  YARN 应用运行日志

    第二天上午

    Hadoop 配置及服务运行日志    

    •  定位配置参数及进行配置变更    

    •  管理角色实例及添加服务    

    •  配置 HDFS 服务      

    •  配置 Hadoop 服务运行日志      

    •  配置 YARN 服务 

     HDFS 导入数据      

    •  使用 Flume 从外部数据源实时导入数据      

    •  使用 Sqoop 从关系数据库导入数据      

    •  REST 接口    

    •  导入数据的最佳实践 

    第二天下午

    Hadoop 机群规划    

    •  规划考虑因素    

    •  硬件选择    

    •  虚拟化选项    

    •  网络因素    

    •  节点配置 

    HiveImpala  Pig 的安装及配置    

    •  Hive    

    •  Impala    

    •  Pig Hadoop 

    第三天上午

    客户端及 Hue    

    •  什么是 Hadoop 客户端      

    •  安装及配置 Hadoop 客户端      

    •  安装及配置 Hue    

    •  使用 Hue 进行身份验证及授权

    机群高级配置    

    •  高级配置参数    

    •  Hadoop 端口配置    

    •  HDFS 机柜感知配置    

    •  HDFS 高可靠性配置 

    第三天下午

    Hadoop 安全    

    •  Hadoop 安全的重要性    

    •  Hadoop 安全性概念    

    •  Kerberos 简介    

    •  使用 Kerberos 保护 Hadoop 机群    

    •  其他安全特性 

    资源管理    

    •  使用静态服务池配置 Linux cgroup    

    •  公平调度器    

    •  配置动态资源池    

    •  YARN 内存及 CPU 设置      

    •  Impala 查询调度 

    第四天上午

    机群维护    

    •  检查 HDFS 状态      

    •  机群间复制数据    

    •  添加/移除机群节点    

    •  机群数据负载平衡    

    •  目录快照    

    •  机群升级 

    第四天下午

    机群监控及排错      

    •  监控 Hadoop 机群      

    •  Hadoop 机群排错    

    •  常见配置不当问题




    举报活动

    活动标签

    您还可能感兴趣

    您有任何问题,在这里提问!

    为营造良好网络环境,评价信息将在审核通过后显示,请规范用语。

    全部讨论

    还木有人评论,赶快抢个沙发!

    活动主办方更多

    时课网

    时课网

    上海碧茂信息科技有限公司,是中国科学院上海计算技术研究所孵化企业,全球顶级大数据科技公司Cloudera中国区合作伙伴,专业大数据解决方案服务商。 公司成立于2011年,肩负推进中国科学院上海计算技术研究所项目成果产业化的使命,致力于中国企业,尤其是金融、政府、电信等行业的数字化转型战略。

    微信扫一扫

    分享此活动到朋友圈

    活动日历   03月
    26 27 28 29 1 2 3
    4 5 6 7 8 9 10
    11 12 13 14 15 16 17
    18 19 20 21 22 23 24
    25 26 27 28 29 30 31

    免费发布