报名即将结束

报名中

报名已结束

大数据商业开发Hadoop&Spark

报名人数 104 收藏(0)
价格:¥19800.00 来源:尚观教育 老师:test_teacher 有效期:无期限
课程班级
2017脱产
  • 1 章: 01-hadoop生态圈简介
  • 01大数据简介
    时长:57:38
  • 02分布式集群的概念
    时长:25:27
  • 03hadoop基础概念讲解
    时长:15:09
  • 04Hadoop基本概念的描述
    时长:33:35
  • 05Hadoop核心简介
    时长:19:09
  • 06VMWare虚拟机安装
    时长:24:12
  • 07linux系统配置
    时长:34:13
  • 08linux下面安装jdk
    时长:12:10
  • 09hadoop的安装与验证
    时长:39:12
  • 2 章: 02-hdfs实战操作
  • 01复习&HDFS的分布式的特点
    时长:20:17
  • 02HDFS之NameNode体系结构说明
    时长:33:16
  • 03错误文件的修改
    时长:04:22
  • 04HDFS之datanode体系结构
    时长:17:03
  • 05HDFS之SHELL操作
    时长:34:33
  • 06maven项目的构建
    时长:39:28
  • 07HDFS Java API之FileSystem类的创建
    时长:15:12
  • 08HDFS Java API之listStatus
    时长:15:52
  • 09HDFS Java API之FileSystem.open操作
    时长:06:25
  • 10HDFS Java API之FileSystem.mkdirs操作
    时长:04:02
  • 11HDFS Java API之FileSystem.create
    时长:02:47
  • 12HDFS Java API之FileSystem
    时长:05:08
  • 13HDFS之Namenode和datanode通信机制
    时长:15:48
  • 14RPC通信基本案例
    时长:28:31
  • 15HDFS读取数据的过程
    时长:12:37
  • 16HDFS之NameNode的HA
    时长:09:06
  • 17HDFS的常见运维操作
    时长:13:36
  • 3 章: 03-hadoop分布式集群搭建
  • 01复习
    时长:03:23
  • 02单NameNode通信机制及两个问题
    时长:32:09
  • 03NameNode的HA问题解决
    时长:27:16
  • 04NameNode的Federation机制
    时长:11:27
  • 05ZooKeeper分布式协调系统的简介
    时长:18:56
  • 06ZooKeeper单机的安装
    时长:25:22
  • 07搭建分布式机器描述说明
    时长:06:08
  • 08搭建分布式集群上
    时长:13:58
  • 09搭建分布式集群网卡主机名和jdk设置
    时长:18:21
  • 10集群规划和配置集群间ssh免密码登录
    时长:14:48
  • 11Hadoop集群搭建之ZK集群搭建
    时长:20:04
  • 12Hadoop集群搭建之Hadoop配置
    时长:24:59
  • 13Hadoop集群的验证工作
    时长:08:52
  • 4 章: 04-mapreduce执行过程
  • 01搭建集群遇到的问题
    时长:10:19
  • 02搭建集群遇到的问题解决二
    时长:29:05
  • 03MapReduce的概述
    时长:15:04
  • 04MapReduce执行流程案例说明
    时长:44:03
  • 05MapReduce执行流程再分析
    时长:16:50
  • 06wordCount项目的构建
    时长:09:36
  • 07WordCount案例实现
    时长:52:43
  • 08WordCount案例的说明和日志查看
    时长:23:26
  • 09MapReducer的Shuffle的执行流程
    时长:21:00
  • 10MapReduce的执行流程图例说明
    时长:25:30
  • 11MapReduce之Combine
    时长:07:23
  • 12统计某一地区全年最高温度和最低温度作业说明
    时长:17:45
  • 5 章: 05-mapreduce高级实战操作
  • 01Hadoop联盟的搭建
    时长:13:37
  • 02最高最低温度作业说明
    时长:14:53
  • 03Hadoop序列化机制简介
    时长:28:44
  • 04Hadoop自定义序列化类案例实战
    时长:47:35
  • 05Hadoop序列化文件SequenceFile操作
    时长:21:27
  • 06InputFormat#getSplits分片过程
    时长:42:14
  • 07MultiFormatOutputs说明案例
    时长:34:32
  • 08基于MR的二次排序
    时长:25:01
  • 09TopN上
    时长:32:11
  • 6 章: 06-Hive表基本操作
  • 01TopN下集
    时长:19:19
  • 02Hadoop复习以及Hive引言
    时长:38:56
  • 03Hive概述
    时长:39:17
  • 04Hive的存储架构概述
    时长:10:07
  • 05Linux在线安装MySQ
    时长:12:38
  • 06Linux离线安装MySQL
    时长:06:39
  • 07Hive的安装
    时长:25:01
  • 08Hive的运行管理方式
    时长:26:06
  • 09Hive的表的创建和数据的加载
    时长:13:29
  • 10Hive数据的加载模式
    时长:22:47
  • 11Hive复合数据类型之array
    时长:17:29
  • 12Hive复合数据类型之map
    时长:13:07
  • 13Hive复合数据类型struct
    时长:11:15
  • 14Hive复合数据综合案例
    时长:27:15
  • 7 章: 07-Hive高级实战函数操作
  • 01复习
    时长:17:29
  • 02表的分类之内部表和外部表
    时长:48:51
  • 03功能表之分区表
    时长:45:23
  • 04功能表之桶表
    时长:40:01
  • 05Hive表数据的加载和导出
    时长:40:35
  • 06Hive函数之case&wordcount
    时长:38:53
  • 07Hive函数之排序
    时长:07:45
  • 08Hive函数之分组排序row_number
    时长:21:35
  • 09Hive的自定义函数编写
    时长:52:53
  • 8 章: 08-hbase入门实战
  • 01行式数据库和列式数据库简介
    时长:52:36
  • 02HBase的简介
    时长:16:55
  • 03HBase的分布式集群的安装
    时长:28:52
  • 04HBase上午总结
    时长:04:54
  • 05HBase的逻辑结构
    时长:30:27
  • 06HBase的物理结构
    时长:19:29
  • 07HBase的shell基本操作
    时长:43:56
  • 08HBase的shell案例练习
    时长:08:42
  • 09HBase的Java API操作之创建一张表
    时长:30:30
  • 10HBase的Java API操作之list列表
    时长:04:46
  • 11HBase的JAVA API之put数据
    时长:09:33
  • 12HBase的JAVA API操作之查询所有scan
    时长:08:49
  • 13HBase的Java API操作之通过行键查询一条记录get操作
    时长:05:25
  • 14HBase的Java API操作之条件查询Filter
    时长:14:20
  • 9 章: 09-hbase高级实战&phoenix&hive整合
  • 01SVN的简单使用说明
    时长:09:49
  • 02HBase的存储数据的过程
    时长:27:16
  • 03HBase物理结构之HMaster
    时长:10:42
  • 04HBase物理结构之HRegionServer
    时长:09:46
  • 05HBase物理结构之HRegion
    时长:30:28
  • 06HBase物理结构之HStore
    时长:18:16
  • 07HBase物理结构之MemStore
    时长:08:04
  • 08HBase物理结构之StoreFile
    时长:04:04
  • 09HBase物理结构之HFile
    时长:39:01
  • 10HBase物理结构之HFile优化建议
    时长:27:11
  • 11HBase行键和列&列族设计的问题
    时长:32:17
  • 12HBase和Hive的整合
    时长:26:17
  • 13HBase和Phoenix的整合一
    时长:27:40
  • 14HBase和Phoenix的整合二
    时长:58:47
  • 10 章: 10-sqoop&flume数据采集实战
  • 01Sqoop的简介
    时长:24:14
  • 02Sqoop的安装配置
    时长:18:50
  • 03Sqoop的简单安装验证
    时长:10:23
  • 04Sqoop的import操作之rdmbs到hdfs
    时长:42:03
  • 05Sqoop的import操作之rdbms到hive&hbase
    时长:08:39
  • 06Sqoop的export的操作
    时长:10:57
  • 07Flume的简介
    时长:44:30
  • 08Flume的安装部署
    时长:11:11
  • 09Flume agent的部署案例之netcat
    时长:39:54
  • 10Flume组件的描述说明
    时长:09:29
  • 11Flume实战案例之监听文件中的新增数据
    时长:19:16
  • 11失败的Flume监听数据调整jvm内存大小的案例
    时长:14:11
  • 12Flumen实战案例之采集目录中的新增数据
    时长:12:26
  • 13Flume实战案例之监听目录新增文件到hdfs指定目录中
    时长:11:42
  • 14Flume事件的总结
    时长:03:00
  • 11 章: 11-kafka消息中间件实战
  • 00flume-oom失败案例的补充说明
    时长:05:19
  • 01消息队列图例说明
    时长:33:56
  • 03消息队列MQ的简介
    时长:12:10
  • 04Kafka的简介&kafka组件介绍
    时长:12:11
  • 05Kafka单机的安装
    时长:39:50
  • 06kafka主题的操作
    时长:22:10
  • 07Kafka-topic生产消费数据之console-shell
    时长:23:59
  • 08Kafka分布式集群的安装
    时长:14:14
  • 09Kafka组件的学习
    时长:16:06
  • 10Kafka Java API学习之生产者Producer
    时长:40:29
  • 11kafka Java API之消费者Consumer
    时长:16:24
  • 12Kafka Java API之自定义分区Partitioner
    时长:25:30
  • 13Kafa应用的说明
    时长:31:22
  • 12 章: 12-redis分布式内存数据库实战
  • 01复习
    时长:14:56
  • 02Redis的简介
    时长:30:21
  • 03Redis的安装部署
    时长:31:43
  • 04Redis数据类型之string的操作
    时长:41:24
  • 05Redis数据类型之hash表
    时长:14:10
  • 06Redis数据类型之list
    时长:21:44
  • 07Redis数据类型之set
    时长:14:23
  • 08Redis数据类型之zset
    时长:15:25
  • 09Redis Java API操作简介
    时长:31:49
  • 10Redis工具类的封装
    时长:08:40
  • 11Redis主从复制集群的配置
    时长:14:50
  • 12Redis高级功能之发布订阅
    时长:20:12
  • 13Redis高级教程之管道和性能测试
    时长:19:00
  • 13 章: 13-elasticsearch分布式搜索引擎
  • 01ElasticSearch简介
    时长:34:30
  • 02Rest的基本了解
    时长:09:53
  • 03ElasticSearch安装和配置
    时长:19:26
  • 04ElasticSearch操作之restfull--curl
    时长:62:08
  • 05ElasticSearch插件的操作
    时长:15:44
  • 06ElasticSearch集群的安装
    时长:37:03
  • 07ElasticSearch核心概念介绍
    时长:17:37
  • 08ElasticSearch之Kibana基本操作和Java API操作一
    时长:50:36
  • 09ElasticSearch之Java API4中方式添加索引
    时长:48:11
  • 10ElasticSearch之Java API更新数据update
    时长:04:18
  • 11ElasticSearch之Java API获取数据get
    时长:05:31
  • 12ElasticSearch之Java API批量操作bulk
    时长:07:06
  • 14 章: 14-elasticsearch中文分词
  • 01ElasticSearch复杂查询一
    时长:59:45
  • 02ElasticSearch复杂查询之分页和QueryType的区别说明
    时长:07:52
  • 03ElasticSearch复杂查询之range查询
    时长:19:30
  • 04ElasticSearch复杂查询之聚合操作
    时长:16:48
  • 05ElasticSearch复杂查询之高亮显示
    时长:16:48
  • 06ElasticSearch中文分词的说明和安装
    时长:49:23
  • 07ElasticSearch中文分词测试
    时长:09:43
  • 08ElasticSearch的操作之Rest查询体操作
    时长:21:36
  • 09ElasticSearch的settings和mapping映射信息
    时长:05:45
  • 10ElasticSearch
    时长:12:38
  • 11ElasticSearch项目说明
    时长:17:15
  • 15 章: 15-storm实战之topology
  • 01大数据基础框架的复习
    时长:16:39
  • 02Storm的简介一
    时长:29:06
  • 03Storm和Hadoop的比较
    时长:06:18
  • 04Storm的Topology图例说明
    时长:16:16
  • 05Storm的Topology的补充说明
    时长:06:50
  • 06Storm的基本案例实时数据累加实战
    时长:72:11
  • 07Storm的基本案例之读取目录中的文件数据实战
    时长:60:37
  • 08Storm中的几个名词解释
    时长:05:47
  • 09Storm集群的安装
    时长:35:46
  • 10Storm运行之集群模式
    时长:19:47
  • 11Storm通过maven打成jar包的第二种方式
    时长:24:47
  • 16 章: 16-storm流式分组&可靠性
  • 01复习
    时长:06:43
  • 02storm核心概念之并行度
    时长:28:45
  • 03storm核心概念之并行度调整worker的个数
    时长:16:53
  • 04storm核心概念之并行度调整executor
    时长:08:19
  • 05storm核心概念之并行度调整task
    时长:13:19
  • 06storm核心概念之并行度调整acke
    时长:09:35
  • 07storm核心概念之弹性计算
    时长:22:45
  • 08storm并行度调整总结
    时长:03:32
  • 09storm流式分组的基本概念和分类
    时长:13:38
  • 10storm流式分组之shuffleGrouping
    时长:10:47
  • 11storm流式分组之allGrouping
    时长:03:21
  • 12storm流式分组之globalGrouping
    时长:06:24
  • 13storm流式分组之noneGrouping
    时长:02:39
  • 14storm流式分组之localOrShuffleGrouping
    时长:08:15
  • 15storm流式分组之fieldsGrouping
    时长:14:08
  • 16storm流式分组之customGrouping
    时长:32:14
  • 17storm流式分组基本案例
    时长:09:31
  • 18storm的可靠性
    时长:24:57
  • 19storm的定时任务说明
    时长:22:05
  • 20storm的定时任务操作
    时长:22:11
  • 17 章: 17-storm-kafka-flume-redis整合实战
  • 01关于maven私服的说明
    时长:06:08
  • 02storm的优化和雪崩效应
    时长:24:05
  • 03shell脚本编写的格式说明
    时长:16:50
  • 04一键启动脚本上
    时长:42:09
  • 05一键启动脚本下
    时长:39:10
  • 06一键停止脚本
    时长:38:27
  • 07storm整合案例需求说明
    时长:33:50
  • 08kafka和flume的整合
    时长:37:35
  • 09kafka和storm的整合
    时长:34:23
  • 10kafka和redis的整合
    时长:39:01
  • 18 章: 18-爬虫主体框架构建
  • 01爬虫的概念和应用简介
    时长:22:46
  • 02爬虫的基本架构
    时长:18:45
  • 03爬虫的基本架构升级
    时长:30:25
  • 04爬虫整体的描述
    时长:10:37
  • 05爬虫项目的搭建
    时长:48:23
  • 06网页内容的下载
    时长:16:22
  • 07爬虫下载的抽取
    时长:09:52
  • 19 章: 19-全网所有数据爬取
  • 01爬虫项目之解析商品ID和商品标题
    时长:34:06
  • 02爬虫项目之解析商品图片url地址
    时长:06:33
  • 03爬虫项目之解析商品的价格
    时长:16:39
  • 04爬虫项目之解析商品规格参数
    时长:28:20
  • 05爬虫项目之解析代码重构
    时长:18:09
  • 06爬虫项目之存储
    时长:23:14
  • 07爬虫项目之存储添加内容至hbase
    时长:32:09
  • 08爬虫项目之解析列表url分析
    时长:21:41
  • 09爬虫项目之解析列表页面中的商品列表url
    时长:20:46
  • 10爬虫项目之解析下一页的url地址
    时长:08:40
  • 11爬虫项目之解析所有商品的分析
    时长:07:48
  • 12爬虫项目之解析所有商品数据
    时长:34:28
  • 20 章: 20-分布式爬虫解决方案一
  • 01复习
    时长:11:27
  • 02爬虫url仓库之高低优先级的队列实现
    时长:27:42
  • 03爬虫url仓库之url仓库数据共享问题的解决
    时长:30:27
  • 04log4j的说明及使用
    时长:54:27
  • 05爬虫ip被封的解决之道--反爬虫
    时长:38:55
  • 06爬虫项目之增加日志信息
    时长:29:07
  • 07爬虫代理ip使用的方式
    时长:21:20
  • 08爬虫项目之开启多线程操作
    时长:19:17
  • 09爬虫项目的maven打包部署
    时长:34:44
  • 21 章: 21-爬虫监控和资源调度
  • 01url调度任务的解析及实现
    时长:71:44
  • 02分布式爬虫面对ip被封的问题解决上
    时长:44:58
  • 03分布式爬虫面对url仓库数据共享问题解决--Redis共享
    时长:11:12
  • 04上午的复习
    时长:03:35
  • 05爬虫之模拟登陆设置
    时长:37:49
  • 06爬虫之监控说明
    时长:11:15
  • 07使用curator框架操作爬虫
    时长:16:05
  • 08使用zk对爬虫进行监听的说明
    时长:19:33
  • 09通过zk对爬虫的监控的代码实现
    时长:49:16
  • 10爬虫报警邮件的发送
    时长:31:36
  • 11爬虫项目的总结
    时长:18:57
  • 22 章: 22-scala函数式编程入门
  • 01scala简介和安装
    时长:24:57
  • 02scala开发工具的说明
    时长:16:00
  • 03scala基础知识和语法上
    时长:30:25
  • 04scala基础知识和语法下
    时长:02:53
  • 05流程控制之if语句
    时长:19:59
  • 06流程控制之while和do..while循环
    时长:20:41
  • 07流程控制之for循环
    时长:15:37
  • 08流程控制之循环结束
    时长:05:45
  • 09流程控制for循环高级特性联系
    时长:09:47
  • 10scala中的异常处理
    时长:20:01
  • 11scala中的函数操作上
    时长:23:57
  • 12scala中的函数操作下
    时长:23:26
  • 13scala中的数组和不可变的数组
    时长:28:21
  • 14scala中数组的高阶操作
    时长:08:18
  • 15scala中的map
    时长:25:34
  • 16scala中的tuple
    时长:14:59
  • 23 章: 23-scala面向对象上
  • 01idea和scala的整合
    时长:16:25
  • 02scala中类的创建&字段设置getter和setter方法
    时长:21:13
  • 03scala中的访问权限修饰符说明
    时长:05:57
  • 04scala中的主构造器
    时长:11:58
  • 05scala中的辅助构造器的创建
    时长:10:32
  • 06scala中的构造器的说明
    时长:04:17
  • 07scala中的嵌套类
    时长:27:27
  • 08scala中的单例对象的说明
    时长:12:48
  • 09scala中的伴生类和伴生对象
    时长:27:45
  • 10scala程序运行的另一种方式
    时长:06:03
  • 24 章: 24-scala面向对象下
  • 01scala中的继承体系
    时长:28:42
  • 02继承体系之类型转换
    时长:33:20
  • 03继承体系之匿名内部类
    时长:23:02
  • 04scala继承体系之抽象
    时长:15:09
  • 05scala继承体系之trait
    时长:26:24
  • 06scala面向函数式编程之函数作为值进行传递
    时长:21:32
  • 07scala面向函数式编程之匿名函数
    时长:05:38
  • 08scala面向函数式编程之高阶函数
    时长:17:20
  • 09scala面向函数式编程之参数(类型)推断
    时长:08:48
  • 10scala面向函数式编程之常见的高阶函数(map&reduce)
    时长:27:44
  • 11scala面向函数式编程之闭包和柯里化
    时长:15:35
  • 12scala集合框架之List上
    时长:12:42
  • 13scala集合框架之List下
    时长:22:33
  • 14scala集合框架之set
    时长:23:33
  • 15scala集合框架之实战操作
    时长:34:55
  • 16java中的lambda表达式简介
    时长:09:43
  • 25 章: 25-scala高级操作akka
  • 01作业的讲解
    时长:24:49
  • 02补充的作用
    时长:04:38
  • 03scala模式匹配值变量和类型
    时长:13:34
  • 04scala模式匹配值样例类
    时长:17:12
  • 05scala模式匹配值option
    时长:16:20
  • 06scala类型参数之泛型类
    时长:14:40
  • 07scala类型参数之泛型函数
    时长:12:19
  • 08scala类型参数之泛型限定
    时长:20:22
  • 09scala类型参数之视图界定
    时长:03:58
  • 10scala类型参数之逆变
    时长:14:55
  • 11scala类型参数协变和逆变说明
    时长:05:57
  • 12scala隐士转换和隐士转换函数一
    时长:11:46
  • 13scala隐士转换参数说明
    时长:26:36
  • 15scala-actor通过样例类进行异步消息的通信
    时长:14:12
  • 16scala-actor通信之线程见通信
    时长:16:10
  • 17scala-akka介绍
    时长:17:23
  • 18scala-akka之单向发送消息
    时长:23:01
  • 19scala-akka之本地线程间的通信
    时长:19:42
  • 20scala-akka之远程通信
    时长:23:56
  • 26 章: 26-spark入门
  • 01大数据的演进
    时长:68:07
  • 02Spark的基本概念的介绍
    时长:40:53
  • 03其它大数据框架简介
    时长:12:12
  • 04spark特点的简介
    时长:07:37
  • 05spark本地安装&linux下scala安装
    时长:15:56
  • 06spark在linux下的单机安装及测试
    时长:22:57
  • 07spark的完全分布式部署
    时长:13:35
  • 08spark的基于zk的ha的配置
    时长:10:33
  • 09spark的编译说明
    时长:08:58
  • 10Spark编译
    时长:11:52
  • 27 章: 27-spark rdd详解
  • 01自己设计一个基于内存的分布式计算框架
    时长:20:22
  • 02基于spark的分布式内存计算的基本原理
    时长:27:37
  • 03spark的核心概念之rdd(重要)
    时长:14:59
  • 04spark的核心概念之常见的名词解释
    时长:16:41
  • 05spark基本案例之java最复杂版本
    时长:44:33
  • 06spark基本案例之java版本说明
    时长:10:14
  • 07spark基本案例之java lambda表达式实现方式
    时长:12:47
  • 08spark基本案例之scala版本
    时长:14:00
  • 09spark加载hdfs上面的数据
    时长:09:04
  • 10spark集群模式加载hdfs上面数据&问题解决
    时长:26:59
  • 11spark提交作业到yarn集群
    时长:25:26
  • 12spark-submit.sh脚本的说明
    时长:05:20
  • 13spark基本案例的图例说明
    时长:38:20
  • 14spark的rdd的创建方式
    时长:13:06
  • 28 章: 28-spark rdd transformation&action实战
  • 01spark作业的执行调度过程
    时长:58:27
  • 02spark算子作用的说明
    时长:11:22
  • 03transformation操作之map
    时长:13:39
  • 04transformation操作之filter
    时长:06:51
  • 05关于rdd.foreach和普通集合的foreach的说明
    时长:09:42
  • 06transformation操作之flatMap
    时长:11:55
  • 07transformation操作之sample
    时长:22:13
  • 08transformation操作之union
    时长:09:17
  • 09transformation操作之groupByKey
    时长:21:56
  • 10transformation操作之reduceByKey
    时长:03:22
  • 11transformation操作join
    时长:20:39
  • 12transformation操作之sortByKey
    时长:35:04
  • 13action操作
    时长:19:44
  • 14spark中核心概念之宽依赖和窄依赖
    时长:10:26
  • 15spark持久化简介&持久化策略选取
    时长:37:05
  • 29 章: 29-spark rdd高级实战共享变量&高级排序&持久化
  • 01复习--spark rdd持久化
    时长:31:51
  • 02spark共享变量值广播变量
    时长:30:12
  • 03spark共享变量之广播变量使用&细节问题
    时长:28:56
  • 04spark共享变量之累加器accumulator
    时长:30:12
  • 05spark二次排序之sortBy
    时长:25:38
  • 06spark二次排序之sortByKey和sortBy比较
    时长:14:48
  • 07spark二次排序之java版本
    时长:08:26
  • 08spark二次排序之java中遇到的一点问题
    时长:10:56
  • 09spark获取TopN之take
    时长:10:46
  • 10spark获取TopN之java上
    时长:34:13
  • 11spark动态获取TopN之java下
    时长:04:10
  • 12spark动态获取topN之scala版本
    时长:10:15
  • 30 章: 30-sparkcore源码之sparkcontext
  • 01spark内核流程剖析图
    时长:45:17
  • 02spark stage阶段划分算法
    时长:31:27
  • 03spark on yarn说明
    时长:47:56
  • 04sparkContext的创建过程之图例
    时长:26:46
  • 05SparkContext的构建之SparkConf的源码说明
    时长:28:41
  • 06SparkContext的构建的过程
    时长:59:43
  • 07MasterHA的切换过程
    时长:11:25
  • 08MasterHA的切换过程源码说明
    时长:33:28
  • 31 章: 31-sparkcore源码之dagscheduler调度过程
  • 01Worker节点上面启动driver和executor的过程
    时长:73:34
  • 02worker节点启动driver和executor的图例过程
    时长:25:30
  • 03job任务提交的过程源码说明
    时长:32:22
  • 04DAGScheduler和TaskScheduler关系图例说明
    时长:10:38
  • 05DAGScheduler处理提交的作业
    时长:49:10
  • 06DAGScheduler提交作业二
    时长:58:45
  • 07Executor进行反向注册和运行executor的过程
    时长:30:07
  • 08Task任务执行的操作
    时长:19:16
  • 32 章: 32-spark优化之开发调优
  • 01spark未经优化的shuffle过程
    时长:58:08
  • 02spark经过优化的shuffle过程
    时长:09:03
  • 03spark shuffle读写的代码过程
    时长:59:42
  • 04spark 性能优化整体介绍
    时长:15:57
  • 05spark开发优化之重复RDD的持久化
    时长:21:54
  • 06spark开发优化之尽量避免使用shuffle类算子
    时长:02:55
  • 07spark开发优化之使用map-side预聚合的shuffle操作
    时长:07:32
  • 08spark开发优化之使用高性能的算子
    时长:57:16
  • 09spark开发优化之使用广播变量去代替join类的操作shuffle算子
    时长:20:35
  • 10spark开发调优之使用kryo的序列化机制
    时长:13:49
  • 11spark开发调优之序列化&本地化
    时长:28:06
  • 33 章: 33-spark调优之数据倾斜
  • 01复习
    时长:30:21
  • 02spark优化之data skew现象简介及发生原因
    时长:16:33
  • 03spark优化之data skew问题的定位
    时长:20:10
  • 04spark优化之data skew方案之HiveETL
    时长:10:12
  • 05spark优化之data skew之过滤少数几个key
    时长:30:03
  • 06spark优化之data skew之提高shuffle的并行度
    时长:06:41
  • 07spark分批向mysql存储代码的修正
    时长:11:44
  • 08spark优化之data skew之两阶段聚合
    时长:37:22
  • 09spark优化之data skew将reduce join转化为map
    时长:06:23
  • 10spark优化之data skew之采样倾斜key并分拆join操作
    时长:54:55
  • 11spark优化之data skew之使用随机前缀和扩容RDD进行join
    时长:05:00
  • 34 章: 34-spark调优之资源调优&shuffle
  • 01spark优化之资源调优
    时长:61:00
  • 02spark优化之jvm说明
    时长:30:45
  • 03spark优化之jvm垃圾回收过程
    时长:40:16
  • 04Spark优化之shuffle
    时长:39:16
  • 05SparkSQL简介一
    时长:22:08
  • 06插播广告之CDH和HDP的说明
    时长:15:22
  • 07SparkSQL官网认识说明.
    时长:17:56
  • 08SparkSQL简介二
    时长:11:43
  • 09SparkSQL之DataFrame创建之JavaBean
    时长:21:47
  • 10SparkSQL之DataFrame简单操作
    时长:13:54
  • 35 章: 35-sparksql入门实战
  • 01SparkSQL创建DataFrame的第三种方式
    时长:27:19
  • 02SparkSQL关于DataFrame的简单操作
    时长:13:35
  • 03SparkSQL之DataFrame和RDD之间的转换
    时长:19:34
  • 04SparkSQL之关于DataFrame缓存表结构说明
    时长:15:26
  • 05SparkSQL之DataFrame的基本操作
    时长:07:13
  • 06SparkSQL之数据加载和落地总结说明
    时长:44:37
  • 07SparkSQL之parquet自动探知分区数据
    时长:21:19
  • 08SparkSQL写数据之foreachPartition
    时长:48:25
  • 36 章: 36-spark整合操作
  • 01sparksql和hive集成上
    时长:35:58
  • 02sparksql和hive集成中
    时长:42:04
  • 03sparkSQL和ES的集成
    时长:48:34
  • 04sparkSQL和Hive集成下
    时长:08:35
  • 05sparkSQL中的开窗函数之row_number统计分组topn
    时长:41:54
  • 06sparkSQL中的自定义函数UDF操作
    时长:11:11
  • 07sparkSQL中的thiftserver操作
    时长:39:02
  • 08sparkSQL综合案例要求说明
    时长:07:14
  • 09SparkSQL综合案例实现过程
    时长:37:57
  • 37 章: 37-sparkstreaming入门操作
  • 01SparkStreaming的简介
    时长:29:22
  • 02SparkStreaming和其它流式组件对比学习
    时长:42:48
  • 03针对不同场景对计算框架的选型
    时长:10:19
  • 04SparkStreaming基本案例说明
    时长:30:00
  • 05SparkStreaming基于网络socket数据处理java版本
    时长:14:49
  • 06SparkStreaming关于receiver和context的说明
    时长:34:17
  • 07SparkStreaming和HDFS的整合操作
    时长:52:13
  • 08关于sparkstreaming接收不到hdfs中的新增文件的说明
    时长:08:39
  • 38 章: 38-sparkstreaming整合kafka
  • 01SparkStreaming和kafka集成方式
    时长:49:24
  • 02SparkStreaming基于Receiver方式集成kafka
    时长:13:30
  • 03SparkStreaming基于Direct方式集成kafka之java版本
    时长:28:11
  • 04基于Direct方式集成Kafka之scala版本
    时长:16:26
  • 05SparkStreaming的transformation操作说明
    时长:08:44
  • 06SparkStreaming应用之在线黑名单过滤.
    时长:23:10
  • 07SparkStreaming应用transform进行在线黑名单过滤.
    时长:43:02
  • 08SparkStreaming应用操作之window操作
    时长:35:59
  • 09应用之DStream状态合并updateStateByKey之java版本
    时长:28:51
  • 10应用DStream合并updateStateByKey之scala版本
    时长:10:57
  • 39 章: 39-sparkstreaming高级函数操作
  • 01SparkStreaming Output操作之foreachRDD-1
    时长:39:33
  • 02SparkStreaming Output操作之foreachRDD-2
    时长:08:28
  • 03SparkStreaming Output操作之foreachRDD-3
    时长:10:28
  • 04SparkStreaming和SparkSQL的整合案例
    时长:46:37
  • 05SparkStreaming的checkpoint机制
    时长:21:38
  • 06SparkStreaming关于DriverHA的问题说明
    时长:11:11
  • 07SparkStreaming程序运行过程中需要注意的几点问题
    时长:25:51
  • 08SparkStreaming优化之接收数据和处理数据
    时长:26:01
  • 09SparkStreaming优化之内存等模块
    时长:19:34
  • 10总结
    时长:42:04
  • 40 章: 40章project-log-analysis
  • 01电商网站日志分析项目之项目简介
    时长:51:05
  • 02maven项目的构建
    时长:14:39
  • 03项目配置管理ConfigurationManager说明
    时长:35:16
  • 04项目配置管理之数据库配置
    时长:14:27
  • 05项目配置管理之工具类说明
    时长:10:51
  • 06用户session分析模块之需求分析
    时长:36:29
  • 07用户session分析模块之需求分析详解
    时长:17:30
  • 08用户session分析模块之数据库设计说明
    时长:29:07
  • 09用户session分析模块之数据库建表和实体类对应
    时长:23:30
  • 10用户session分析模块之TaskDao构建
    时长:12:36
  • 11用户session分析模块之dao模块实现二
    时长:41:35
  • 41 章: 41章project-log-analysis
  • 01用户session分析模块之Spark作业的创建
    时长:32:07
  • 02用户session分析模块之模拟数据生成
    时长:15:11
  • 03用户session分析模块之获取任务参数
    时长:13:15
  • 04用户session分析模块之获取用户指定范围内的基础数据
    时长:22:18
  • 05用户session分析模块之数据过滤上
    时长:50:55
  • 06用户session分析模块之session局部聚合上
    时长:74:09
  • 07用户session分析模块之session局部聚合下
    时长:39:35
  • 08用户session数据模块之session和userinfo之间的聚合
    时长:16:55
  • 09用户session分析模块之session数据过滤
    时长:38:38
  • 42 章: 42章project-log-analysis
  • 01复习昨天遗留下来的过滤数据问题
    时长:18:08
  • 02过滤重构之自定义累加器
    时长:56:44
  • 03将session聚合状态汇总结果录入到MySQL
    时长:34:10
  • 04随机抽取session的思路
    时长:28:13
  • 05获取随机索引列表
    时长:58:00
  • 06根据随机索引列表获取到对应的session并保存到数据
    时长:31:29
  • 07获取抽取session列表的详细信息到数据库
    时长:31:41
  • 08获取品类id对应的点击订单支付次数的top10
    时长:98:42
  • 43 章: 43章project-log-analysis
  • 01用户session分析模块之top10品类对应的活跃用户的分析思路
    时长:17:24
  • 02用户session分析模块之top10品类编码上
    时长:08:19
  • 03用户session分析模块之top10session品类数据获取
    时长:33:39
  • 04用户session分析模块获取用户的信息编码完成
    时长:20:55
  • 05用户session分析模块top10活跃用户测试
    时长:07:16
  • 06关于用户session分析模块优化的说明
    时长:03:21
  • 07页面单挑转换率的需求分析&设计方案&数据库设计
    时长:29:52
  • 08单页单挑转换率的编码上
    时长:16:21
  • 09页面单挑转换率思路分析
    时长:28:55
  • 10页面单挑转换率页面排序
    时长:24:16
  • 11计算出每个页面切片的pv
    时长:30:03
  • 12计算起始页面的PV
    时长:07:56
  • 13计算每个切片页面的转换率
    时长:26:06
  • 14将页面切片转换率数据保存到数据库
    时长:05:38
  • 15测试及其代码修正
    时长:24:29
  • 16实时广告流量统计的需求分析&数据库设计
    时长:12:01
  • 17实时广告数据流量之dao编码上
    时长:53:20
  • 44 章: 44章project-log-analysis
  • 01完成剩余dao的开发工作
    时长:30:31
  • 02Dao在线断点测试
    时长:28:50
  • 03初始化广告实时操作Streaming流
    时长:11:43
  • 04基础数据生成
    时长:21:41
  • 05黑名单过滤思路讲解
    时长:26:19
  • 06黑名单过滤的实现
    时长:21:53
  • 07-0动态更新黑明单数据
    时长:44:58
  • 07-1动态更新黑名单测试
    时长:04:10
  • 08每天各省各城市各广告的点击流量实时统计
    时长:29:23
  • 09每天各省广告点击top3实现
    时长:28:53
  • 10基于分钟级别的广告点击趋势计算
    时长:26:02
  • 11代码的整体测试
    时长:07:36
暂无直播课程内容!
暂无课程资料!
还没有课程介绍...

课程公告

    暂无课程公告

最新学员

  • 赫兰峰

  • 赵长江

  • 赵永刚

  • 姚超

  • 顾明晖

  • 贺李胜

  • 王艳

  • 苏晓虎

  • 宋时雨

  • 刘丽华

  • 张赛男

  • 刘烁