1.课程介绍

    学员将学习关键概念和掌握使用最新技术和工具将数据采集到 Hadoop 机群并进行行处理。通过学习掌握诸如 Spark(包括 Spark Streaming Spark SQL)、FlumeKafka 以及 Sqoop 这样的 Hadoop 生态系统工具和技术,Hadoop 开发员将具备解决实际大数据问题和挑战的能力。使用Spark,不同行业的开发人员可以为不同的商业应用和系统架构编写复杂的并行应用。

 

2.培训内容

 通过讲师的理论教学与实操演练,学员将学习以下内容:

 ●Hadoop机群上进行分布式存储和处理数据

通过在Hadoop机群上编写、配置和部署Apache Spark应用

使Spark Shell进行互式数据分析

使Spark SQL查询处理结构化数据

使Spark Steaming处理流式数据

使FlumeKafkaSpark Streaming采集流式数据

 

3.适用学员

有编程经验的开发人员及工程师学员(无需Apache Hadoop基础,但需具备一定的SQL知识水平,且熟练掌握Linux命令行;培训内容中对Apache Spark的介绍所涉及的代码及练习使用ScalaPython,因此需至少掌握其中一种编程语言。)

 

4.课程咨询

 、业。

网址:http://www.hadoopcn.cn

电话:0919-6588836

联系人:13571919256(郭老师)

邮箱:Cloudera2018@bigdatacollege.cn

           2380416854@qq.com