IT易学网-IT在线教育交易平台

IT易学网 > 面授 > 其它

  • 课程简介
  • 讲师介绍
  • 累积评价(0)
  • 该老师还开设以下课程
  • 一.培训内容

          ●  通过讲师在课堂上的讲解,以及实操练习,学员将学习以下内容:

          ●  ClouderaManager管理集群的特性,诸如日志汇总、配置管理、资源管理、报告、报警及服务管理等。

          ●  YARN、MapReduce、Spark及HDFS的工作原理。

          ●  如何为你的集群选取合适的硬件和架构。

          ●  如何将Hadoop集群和企业已有的系统进行无缝集成。

          ●  如何使用Flume进行实时数据采集以及如何使用Sqoop在RDBMS和Hadoop集群之间进行数据导入导出。

          ●  如何配置公平调度器为Hadoop上的多用户提供服务级别保障。

          ●  产品环境中Hadoop集群的运维实践。

          ●  Hadoop集群排错、诊断问题和性能调优。

    二.培训对象及学员基础

      面向系统管理员和IT经理,需具备Linux经验,无需ApacheHadoop基础。

      三.认证

      结束本课程培训后,我们建议学员准备并注册参加CCAHadoop管理员考试。通过并获取该证书是向公司及客户证明个人在Hadoop领域的技术和专长的有力依据。

      四.课程大纲

        1.  ApacheHadoop介绍

          ●  Hadoop的创建动机

          ●  基本概念

          ●  Hadoop核心部件

        2.  Hadoop集群安装

          ●  集群管理方案

          ●  ClouderaManager特性

          ●  Clouderamanager安装

          ●  Hadoop(CDH)安装

        3.  Hadoop分布式文件系统(HDFS)

     ●  HDFS特性

          ●  读写文件

          ●  NameNode内存考虑

          ●  HDFS安全简介

          ●  HDFSWebUI

          ●  使用HDFSShell

        4.  YARN上的MapReduce和Spark

          ●  计算平台在Hadoop里扮演的角色

          ●  YARN:集群资源管理器

          ●  MapReduce概念

          ●  ApacheSpark概念

          ●  Yarn上的计算平台

          ●  通过WebUI及Shell观察YARN应用

          ●  YARN应用运行日志

        5.  Hadoop配置及服务运行日志

          ●  ClouderaManager配置管理机制

          ●  定位配置参数及进行配置变更

          ●  管理角色实例及添加服务

          ●  配置HDFS服务

          ●  配置Hadoop服务运行日志

          ●  配置YARN服务

        6.  HDFS数据导入

          ●  使用Flume从外部数据源实时

          ●  导入数据

          ●  使用Sqoop从关系数据库导入数据

          ●  REST接口

          ●  导入数据的实践

        7.  Hadoop集群规划

          ●  规划考虑因素

          ●  硬件选择

          ●  虚拟化选项*

          ●  网络因素

          ●  节点配置

        8.  Hive,Impala及Pig安装及配置

          ●  Hive

          ●  Impala

          ●  Pig

        9.  Hadoop客户端及Hue

          ●  什么是Hadoop客户端

          ●  安装及配置Hadoop客户端

          ●  安装及配置Hue

          ●  使用Hue进行身份验证及授权

      10.  集群高级配置

          ●  高级配置参数

    ●  Hadoop端口配置

          ●  HDFS机柜感知配置

          ●  HDFS高可靠性配置

      11.  Hadoop安全

          ●  Hadoop安全的重要性

          ●  Hadoop安全性概念

          ●  Kerberos简介

          ●  使用Kerberos保护Hadoop集群

          ●  其他安全概念

      12.  资源管理

          ●  使用静态服务池配置Linuxcgroup

          ●  公平调度器

          ●  配置动态资源池

          ●  YARN内存及CPU设置

          ●  Impala查询调度

      13.  集群维护

          ●  检查HDFS状态

          ●  集群间复制数据

          ●  添加/移除集群节点

          ●  集群数据负载平衡

          ●  目录快照

          ●  集群升级

      14.  集群监控及排错

          ●  ClouderaManager监控特性

          ●  监控Hadoop集群

          ●  Hadoop集群排错

          ●  常见配置不当问题

  • 罗老师

    讲师职称

    恩墨学院大数据培训产品总监,前甲骨文Oracle BigData 一体机咨询顾问

    擅长领域

    大数据,数据库讲师介绍恩墨学院大数据培训产品总监,前甲骨文Oracle BigData 一体机咨询顾问, 擅长利用MDB DTrace 剖析系统原理,解决系统数据库与操作系统兼容性的诸多问题。在 Oracle 解决方案中心任职期间,接触大量一线大数据应用案例,同时取得国际商业大数据领导公司 Cloudera 的 ACTP 认证讲师资质。 同时还获得:Oracle OCM 10g、Cloudera Certified Administrator for Apache Hadoop (CCAH)。 在此之前曾任职于中科红旗(RedFlag-Linux)操作系统服务器组,负责操作系统安全、虚拟化产品自动化测试套件开发

  • 累积评价:0条

    与描述相符 0.0
    0.0
  • < > 共0页

———— 相关面授课程 ————

更多>>
立即注册 认证讲师 在线咨询 ×