中国信息化培训中心

7x24小时咨询热线

400-660-3310

当前位置 : 好学校 北京大数据 中国信息化培训中心 课程正文

人看过 人预约 收藏分享

北京大数据平台搭建与高性能计算实战班

授课方式 :
上课时段:

上课校区:

报读该课程可在好学校领取返现奖励72元

微信扫码添加老师好友咨询

中国信息化培训中心

中国信息化培训中心

认证等级

信誉良好,可安心报读

中国信息化培训中心

已获好学校V2信誉等级认证

信誉值

  • (60-80)基础信誉积累,可放心报读
  • (81-90)良好信誉积累,可持续信赖
  • (91-100)充分信誉积累,推荐报读

与好学校签订读书保障协议:

在线咨询
2018.11.14 王*学 151*****049 咨询了 开课校区
2018.06.13 张*生 189*****966 咨询了 开课校区
2018.06.12 点*点 139*****040 咨询了 开班时间
2018.04.20 何*生 185*****106 咨询了 课程费用
2017.09.25 李*姐 156*****156 咨询了 周边交通
2017.07.06 邸*生 151*****357 咨询了 开班时间
2017.06.24 周*士 130*****002 咨询了 授课师资
2017.06.24 周*士 130*****002 咨询了 招生对象
2016.10.18 孔*姐 176*****216 咨询了 课程费用
2016.10.09 杨*生 137*****366 咨询了 上课时段
2016.03.19 高*飞 136*****686 咨询了 上课时段
2016.03.18 方*超 187*****557 咨询了 上课时段
2015.09.01 张*月 182*****313 咨询了 招生对象
2015.07.29 王*生 150*****786 咨询了 周边交通
2018.12.11 赵*秋 158*****911 咨询了 课程费用
北京大数据平台搭建与高性能计算实战班
大数据平台搭建与高性能计算最 佳实战

【培训收益】

通过此次课程培训,可使学习者获得如下收益:

1.深刻理解在“互联网+”时代下大数据的产生背景、发展历程和演化趋势;

2.了解业界市场需求和国内外最 新的大数据技术潮流,洞察大数据的潜在价值;

3.理解大数据项目解决方案及业界大数据应用案例,从而为企业在大数据项目中的技术选型及技术架构设计提供决策参考;

4.掌握业界最 流行的Hadoop与Spark大数据技术体系;

5.掌握大数据采集技术;

6.掌握大数据分布式存储技术;

7.掌握NoSQL与NewSQL分布式数据库技术;

8.掌握大数据仓库与统计机器学习技术;

9.掌握大数据分析挖掘与商业智能(BI)技术;

10.掌握大数据离线处理技术;

11.掌握Storm流式大数据处理技术;

12.掌握基于内存计算的大数据实时处理技术;

13.掌握大数据管理技术的原理知识和应用实战;

14.深入理解大数据平台技术架构和使用场景;

15.娴熟运用Hadoop与Spark大数据技术体系规划解决方案满足实际项目需求;

16.熟练地掌握基于Hadoop与Spark大数据平台进行应用程序开发、集群运维管理和性能调优技巧;

17.掌握基于Flink的大数据实时处理技术与批处理操作。

 【培训特色】

1.课程培训业界最 流行、应用最广泛的Hadoop、Spark和Flink大数据技术体系。强化大数据平台的分布式集群架构和核心关键技术实现、大数据应用项目开发和大数据集群运维实践、以及Hadoop、Spark与Flink大数据项目应用开发与调优的全过程沙盘模拟实战;

2.通过一个完整的大数据开发项目及一组实际项目训练案例,完全覆盖Hadoop、Spark与Flink生态系统平台的应用开发与运维实践。课堂实践项目以项目小组的形式进行沙盘实操练习,重点强化理解Hadoop、Spark与Flink大数据项目各个阶段的工作重点,同时掌握作为大数据项目管理者的基本技术与业务素养;

3.本课程的授课师资都是有着多年在一线从事Hadoop、Spark与Flink大数据项目的资深讲师,采用原理技术剖析和实战案例相结合的方式开展互动教学、强化以建立大数据项目解决方案为主体的应用开发、技术讨论与交流咨询,在学习的同时促进讲师学员之间的交流,让每个学员都能在课程培训过程中学到实实在在的大数据技术知识体系,以及大数据技术应用实战技能,具备实际大数据应用项目的动手开发实践与运维管理部署能力。授课过程中,根据学员需求,增设交流环节,可将具体工作中遇到的实际问题展开讨论,讲师会根据学员的实际情况微调授课内容,由讲师带着全部学员积极讨论,并给出一定的时间让学员上台发言,现场剖析问题的症结,规划出可行的解决方案。

【课程安排】

第 一天

上午大数据技术基础

1.大数据的产生背景与发展历程

2.大数据的4V特征,以及与云计算的关系

3.大数据应用需求以及潜在价值分析

4.业界最 新的大数据技术发展态势与应用趋势

5.大数据思维的转变

6.大数据项目的系统与技术选型,及落地实施的挑战

7.“互联网+”时代下的电子商务、制造业、交通行业、电信运营商、银行金融业、电子政务、移动互联网、教育信息化等行业应用实践与应用案例介绍

业界主流的大数据技术方案

1.大数据软硬件系统全栈与关键技术介绍

2.大数据生态系统全景图

3.主流的大数据解决方案介绍

4.Apache大数据平台方案剖析

5.CDH大数据平台方案剖析

6.HDP大数据平台方案剖析

7.基于云的大数据平台方案剖析

8.大数据解决方案与传统数据库方案比较

9.国内外大数据平台方案与厂商对比

大数据计算模型(一)——批处理MapReduce

1.MapReduce产生背景与适用场景

2.MapReduce计算模型的基本原理

3.MapReduce作业执行流程

4.MapReduce编程模型:Map处理和Reduce处理

5.MapReduce处理流程:数据读取collect、中间数据sort、中间数据spill、中间数据shuffle、聚合分析reduce

6.MapReduce开发高级应用:Combiner技术与应用场景、Partitioner技术与应用场景、多Reducers应用

7.MapReduce开发与应用实战:Hadoop平台搭建与运行;MapReduce安装与部署

8.应用案例:基于HDFS+MapReduce集成的服务器日志分析采集、存储与分析MapReduce程序实例开发与运行

9.MapReduce参数调优与性能优化技巧

第 一天

下午大数据存储系统与应用实践

1.分布式文件系统HDFS产生背景与适用场景

2.HDFS master-slave系统架构与读写工作原理

3.HDFS核心组件技术讲解,NameNode与fsimage、editslog,DataNode与数据块

4.HDFS Federation机制,viewfs机制,使用场景讲解

5.HDFS高可用**机制,SecondaryNameNode,NFS冷备份,基于zookeeper的HA方案

6.HDFS参数调优与性能优化

大数据实战练习一1.Hadoop平台搭建、部署与应用实践,包含HDFS分布式文件系统,YARN资源管理软件,MapReduce计算框架软件

2.HDFS文件、目录创建、上传、下载等命令操作,HDFS合并、归档操作,HDFS监控平台使用

3.MapReduce程序在YARN上运行,YARN监控平台使用

第二天

上午Hadoop框架与生态发展,以及应用实践操作

1.Hadoop的发展历程

2.Hadoop 1.0的核心组件Jobtracker,Tasktracker,以及适用范围

3.Hadoop 3.0的核心组件YARN工作原理,以及与Hadoop 1.0的联系与区别

4.Hadoop关键机制:任务推测执行,任务容错,任务选择执行,心跳机制

5.HadoopYARN的资源管理与作业调度机制:FIFO调度,Capacity调度器,Fair调度器

6.Hadoop常用参数调优与性能优化技术

大数据计算模型(二)——实时处理/内存计算Spark

1.MapReduce计算模型的瓶颈

2.Spark产生动机、基本概念与适用场景

3.Spark编程模型与RDD弹性分布式数据集的工作原理与机制

4.Spark实时处理平台运行架构与核心组件

5.Spark RDD主要transformation:map,flatMap,filter,union,sample,join,reduceByKey,groupByKey

6.Spark RDD主要action:count,collect,reduce,saveAsTextFile

7.Spark宽、窄依赖关系与DAG图分析

8.Spark容错机制

9.Spark作业调度机制

10.Spark缓存机制:Cache操作,Persist操作与存储级别

11.Spark作业执行机制:执行DAG图、任务集、executor执行模型、BlockManager管理

12.Spark standardalone,Spark on YARN运行模式

13.Scala开发介绍与Spark常用transformation函数介绍

14.Spark调优:序列化机制、RDD复用、Broadcast机制、高性能算子、资源参数调优

第二天

下午大数据仓库查询技术Hive、SparkSQL、Impala,以及应用实践

1.基于MapReduce的大型分布式数据仓库Hive基础知识与应用场景

2.Hive数据仓库的平台架构与核心技术剖析

3.Hive metastore的工作机制与应用

4.Hive内部表和外部表

5.Hive分区、分桶机制

6.Hive行、列存储格式

7.基于Spark的大型分布式数据仓库SparkSQL基础知识与应用场景

8.Spark SQL实时数据仓库的实现原理与工作机制

9.SparkSQL数据模型DataFrame

10.SparkSQL程序开发与

11.SparkSQL数据读取与结果保存:json,Hive table,Parquet file,RDD

12.SparkSQL和Hive的区别与联系

13.SparkSQL操作实战

14.基于MPP的大型分布式数据仓库Presto基础知识与应用场景

15.Presto实时查询系统平台架构、关键技术介绍,以及与Hive,SparkSQL的对比

Hadoop集群运维监控工具1.Hadoop运维管理监控系统Ambari工具介绍

2.第三方运维系统与工具Ganglia,Nagios

大数据实战练习二

1.基于Hadoop平台搭建、部署与配置Spark集群,Sparkshell环境实践操作,Spark案例程序分析

2.基于sbt的Spark程序编译、开发与提交运行

3.应用案例一:基于Spark的服务器运行日志TopN分析、程序实例开发

4.应用案例二:基于Spark的搜索引擎日志热词与用户分析、程序实例开发

5.基于MapReduce的Hive数据仓库实践,Hive集群安装部署,基于文件的Hive数据仓库表导入导出与分区操作,Hive SQL操作,Hive客户端操作

6.SparkSQL shell实践操作:数据表读取、查询与结果保存

第三天

上午大数据计算模型(三)——流处理Storm,SparkStreaming

1.流数据处理应用场景与流数据处理的特点

2.流数据处理工具Storm的平台架构与集群工作原理

3.Storm关键技术与并发机制

4.Storm编程模型与基本开发模式

5.Storm数据流分组

6.Storm可靠性**与Acker机制

7.Storm应用案例分析

8.流数据处理工具Spark Streaming基本概念与数据模型

9.SparkStreaming工作机制

10.SparkStreaming程序开发介绍

11.SparkStreaming的全局统计和窗口函数

12.Storm与SparkStreaming的对比

13.SparkStreaming开发案例:基于文件流的SparkStreaming程序开发;基于socket消息的SparkStreaming程序开发

大数据与机器学习技术

1.机器学习发展历程

2.机器学习与大数据关联与区别

3.数据挖掘经典算法

4.预测算法:线性回归与应用场景,非线性回归与应用场景

5.分类算法:逻辑回归与应用场景,决策树与应用场景,朴素贝叶斯算法与应用场景,支持向量机算法与应用场景

6.聚类算法;k-means与应用场景

7.基于Hadoop的大数据机器学习技术

8.基于MapReduce的机器学习库Mahout

9.Mahout支持的数据挖掘算法

10.Mahout编程模型与发

11.基于Spark的机器学习库Spark MLlib

12.Spark MLlib支持的数据挖掘算法

13.Spark MLlib编程模型与开发:基于Spark MLlib的文本分类,基于Spark MLlib的聚类

第三天

下午大数据ETL操作工具,与大数据分布式采集系统

1.Hadoop与DBMS之间数据交互工具的应用

2.Sqoop导入导出数据的工作原理

3.Flume-NG数据采集系统的数据流模型与系统架构

4.Kafka分布式消息订阅系统的应用介绍与平台架构,及其使用模式

面向OLTP型应用的NoSQL数据库及应用实践

1.关系型数据库瓶颈,以及NoSQL数据库的发展,概念,分类,及其在半结构化和非结构化数据场景下的适用范围

2.列存储NoSQL数据库HBase简介与数据模型剖析

3.HBase分布式集群系统架构与读写机制,ZooKeeper分布式协调服务系统的工作原理与应用

4.HBase表设计模式与primary key设计规范

5.文档NoSQL数据库MongoDB简介与数据模型剖析

6.MongoDB集群模式、读写机制与常用API操作

8.键值型NoSQL数据库Redis简介与数据模型剖析

9.Redis多实例集群架构与关键技术

10.NewSQL数据库技术简介及其适用场景

大数据ELT数据采集与应用实战

1.Sqoop安装、部署与配置,基于Sqoop、MySQL与Hive操作MySQL数据库与Hive数据仓库数据导入导出

2.Kafka安装、部署与配置,基于Kafka创建和消费topic实践操作

3.Flume+HDFS+MapReduce/Spark大数据采集、存储与分析实践操作

新一代大数据处理引擎Flink Flink简介,Flink的体系架构,对比:Flink、Storm和Spark Streaming,Standalone的模式,Yarn模式的两种模式,Yarn两种模式的区分,Flink on yarn内部实现,ZooKeeper的体系架构,Flink Standalone HA配置,Flink on Yarn HA配置,Flink批处理开发,Flink流处理开发,Flink的窗口操作,Flink scala shell代码调试

第四天学习考核与业内经验交流

 【授课专家】

赵老师 清华大学计算机双学士

赵老师 清华大学计算机双学士,京东大学大数据学院院长,甲骨文(中国)软件系统有限公司高级技术顾问,大数据、数据库、中间件技术和Java专家。16年IT行业从业经历,10年培训授课经验。具有丰富的大数据方法论、数据科学、大数据生态圈技术知识和大数据规划建设、应用实施和客户培训经验。

张老师 天津大学软件工程硕士

张老师 天津大学软件工程硕士,10多年的IT领域相关技术研究和项目开发工作,在长期软件领域工作过程中,对软件企业运作模式有深入研究,熟悉软件质量**标准ISO9003和软件过程改进模型CMM/CMMI,在具体项目实施过程中总结经验,有深刻认识。通晓多种软件设计和开发工具。对软件开发整个流程非常熟悉,能根据项目特点定制具体软件过程,并进行项目管理和监控,有很强的软件项目组织管理能力。对C/C++ 、HTML 5、python、Hadoop、java、java EE、android、IOS、大数据、云计算有比较深入的理解和应用,具有较强的移动互联网应用需求分析和系统设计能力,熟悉Android框架、IOS框架等技术,了解各种设计模式,能在具体项目中灵活运用。

蒋老师 清华大学博士

蒋老师 清华大学博士,云计算专家 熟悉主流的云计算平台,并有商业与开源云计算平台的实践经验,对云计算关键技术有深刻了解和实践经验,如分布式系统、虚拟化、分布式文件系统、云存储等,参与并领导多个大型云计算项目。对大数据关键技术有深刻了解和实践经验,如NoSQL数据库、大数据处理、Hadoop、Hive、HBase、Spark等。

【关于学校】

中培坚持以协助企业发展,提升员工IT职业技能为目标。力求打造从IT培训、IT规划咨询、到IT技术支撑的落地服务闭环。主要涉及培训业务和咨询业务两大版块。其中,培训业务涉及产品设计、软件开发、IT管理、数据库、IT运维、大数据、信息安全、人工智能等八大版块。咨询业务涉及大型集团化企业的IT战略规划、IT架构规划、IT综合管控、信息安全等领域。
借助于优质的专家资源,中培已经为中国工商银行、中国农业银行、中国银行、中国平安、交通银行、中国邮政、中国联通、中国电信、上汽集团、一汽集团、格力、中国石化、百度、浪潮、联想等企业在内的,共计178家,提供高质量的定制化培训课程1432门。累计服务32631人次,累计服务时长达52658小时,企业满意度高达95.36%。
在中国IT技术高速发展的近20年,中培紧随趋势稳步发展,正逐渐成长为业内TOP级的高端信息化服务平台型企业。
中培14年的历程,正是因为客户的信任和支持,才取得了长足的进步和发展,才有了立足于IT培训行业的骄人实力。

【企业使命】

培养卓越IT经理人
助力企业全面提升IT技术管理水平

【金 牌客户】

金 牌客户

开班信息

学时
学费
操作

    校区地址

    广州
    北京
    二维码

    微信扫一扫,发送到手机

    随时随地,用手机查看地图路线,更可实时导航,轻松到校!

    教学环境

    更多 >
    环境/教学大图
    环境/教学大图
    环境/教学大图
    环境/教学大图

    读书保障 :

    • 正规资质

      所有学校都经过好学校品牌认证,办学许可证、工商营业执照。

    • 免费求学顾问

      通过好学校咨询,你可获得好学校免费求学顾问1对1专业服务,助你快速找到满意学校!

    • 优质教学

      通过好学校报读,你将可在好学校进行课程点评,你的评价将影响学校招生,学校会更重视你,给你更优质教学,避免你差评。

    • 消费权益保障

      通过好学校报读,若你与学校发生纠纷,你可获得好学校来自第三方的平台保障,协助你让学校退款,维护你的合法权益!

    更多适合课程

    全城大数据学校,一网打尽,立即搜索:

    城市 : 求学课程 : 上课时间 :

    课程咨询

    好学校二维码

    随时随地与老师微信互动

    在线预约免费试听

    • 现在免费预约试听,报名可最高返现
    • 获取验证码
    ;