收起
一、培训收益
本培训课程主要从组件的架构原理、安装、配置、运维、调优等方面进行讲解。通过此次课程培训,可使学习者获得如下收益:
1、掌握大数据平台实现安装、配置、监控;
2、理解并掌握分布式存储 HDFS 上的文件操作及运维命令;
3、外部数据导入 Yarn 运行、调度Spark 任务 ;
4、 SQL on Hadoop;
5、掌握分布式下的事务操作;
6、掌握基于内存/SSD 的优化加速;
7、理解并掌握Hyperbase 数据库。
二、培训特色
1、课程注重学练结合的方法,会采取课中练习的方法,充分调动学习者思考的积极性,在做中掌握相关知识和技能;
2、专家讲师精彩内容解析、学院专题讨论、研究;
3、通过全面知识理解、技能演示和实践引导学员掌握课程内容。
三、培训人群及预备技能
1、运维实施工程师;
2、系统管理员;
3、IT项目经理。
要求熟练使用Linux、了解SQL语法及数据库基本概念。
四、培训费用
培训费6000元/人(含培训费、场地费、资料费),食宿自理。可咨询:18310280875
五、课程大纲
序号 | 课程大纲 |
1 | ² 大数据简介 |
2 | ² 分布式存储 HDFS n HDFS 的特点 n 内部角色 NameNode 与 DataNode n 文件的可靠性存储 n 解析文件读写过程 n Client 操作 HDFS 的常用命令 n 运维管理 HDFS |
3 | ² 分布式资源调度 Yarn n Yarn 架构与 Resource Manager、Node Manager n 分布式资源封装与管理 n Yarn 下的调度器策略 n 解析作业提交执行过程 |
4 | ² 分布式计算框架 n MapReduce 特点 n 解析 Mapper—Reducer 运行机制 n 高性能的计算框架 Spark n 弹性分布式数据集 RDD 与DAG |
5 | ² NoSQL 数据库 Hyperbase n Hyperbase 中的数据模型 n 架构与 Master、RegionServer n 数据读写流程 n 非结构化数据存储 Object Store 简介 n 丰富的索引组合 n SQL for Elastic Search |
6 | ² SQL 执行引擎 n 组成架构介绍 n SQL 语法介绍之 DDL n SQL 语法介绍之 DML n SQL 语法介绍之 DQL n 存储过程介绍 n 大数据量下的通用优化策略 n 各种表的总结与应用场景选择 |
7 | ² 大数据平台流处理 n 流处理概念 n SQL 定义语法 |
8 | ² 平台安全管控 n 安全协议 n 各组件安全下的操作 |
9 | ² 集群规划与运维诊断 |
10 | ² 总结 |