深入大数据架构师之路,问鼎40万年薪龙果学院
【课程介绍】
017-深入大数据架构师之路,问鼎40万年薪-龙果学院
大数据真的很难吗?不见得,如果你想做个开发工程师的话,map reduce、spark 的编程范式对于有一定开发经验的程序员来说,上手是很快的。但根据讲师自己多年的经验来说,单纯做程序员很容易思维固化、眼界局限,重复的发明轮子。但是要想再往高一层的level晋升,比如架构师级别,那hdfs、yarn、hive、hbase、kafka、zookeeper、impala、presto、phoenix、kylin、CAP、ELK、Solr一大堆面目可憎的小怪兽就成了拦路虎。
大数据的难点在于它的生态系统太庞杂,家族血统太混乱,面对一个企业场景有n多的方案说“我行,我不是一般人”。就好比吃顿午餐,既可以端着碗吃,也可以就着锅吃,甚至倒到桌上手抓。每种吃法都能吃饱,但有的吃相很自然、很舒服,有的吃法很别扭,很猥琐。如何温文尔雅、如沐春风这就体现架构师的水平了。
本课程根据老师多年在国内一线互联网公司实际工作经验,整理提炼的一套侧重培养大数据架构师级别的实战课程,讲重点介绍大数据在一线企业中的使用方案,对于各个组件,除了详细介绍必须掌握的操作要领,更重点介绍不同业务场景下的设计和应用技巧。绝不同于市面上大多数的操作手册朗读者。
本课程设计包括如下几个层面:
相信通过本课程的学习,勤奋的您已经深入到大数据的架构师层面,剩下来的就是在工作中不断的填坑不断的打怪升级,最终圆满。
【课程目录】
第1章 第一章
第1讲 课程体系介绍免费 00:27:03| 下载课件
第2讲 hadoop精讲之map reduce原理及代码演示免费 00:30:25| 下载课件
第3讲 hadoop精讲之hdfs详解(1)免费 00:21:35| 下载课件
第4讲 hadoop精讲之hdfs(2)免费 00:25:35
第5讲 hadoop产品选型免费 00:15:58
第6讲 实战.基于hadoop streaming的wordcount免费 00:23:47
第7讲 实战.topn的实现原理和实战00:17:31
第8讲 实战.join的实现原理和实战00:17:53
第9讲 实战.对join实现的改进——优化reducer00:12:45
第10讲 hive概述00:26:20| 下载课件
第11讲 hive必须要会的操作演示00:29:56
第12讲 分区表和动态分区的使用00:25:13
第13讲 函数概述和udf演示00:20:00
第14讲 UDF实战:实现udf00:15:56
第15讲 UDAF实战:实现udaf00:24:34
第16讲 数据说明和重要操作演示00:24:03
第17讲 用户内容偏好实战00:17:03
第18讲 什么是SCD以及技术难点00:20:25
第19讲 如何在hive中实现sequence功能00:13:49
第20讲 数据仓库实战:在hive中实现 scd2的完整案例实战00:21:18
第21讲 数据仓库实战:在hive中实现事实表00:24:33
第22讲 presto是什么.presto的架构00:27:52
第23讲 presto运行机制和配置文件详解00:19:58
第24讲 presto on hive 实战.实现数据仓库的Scd2和fact00:23:00
第25讲 kafka架构深度剖析_100:15:20| 下载课件
第26讲 kafka架构深度剖析_200:15:22
第27讲 架构师装逼必备–CAP理论以及在架构设计中的应用00:32:29
第28讲 kafka数据复制高可用的原理00:21:00
第29讲 kafka数据复制演示00:12:58
第30讲 选学–深入解释leader和follower数据同步机制00:16:56
第31讲 kafka数据一致性参数详解00:16:40
第32讲 数据一致性的实战00:10:22
第33讲 配置zookeeper集群并验证00:09:58
第34讲 配置kafka集群并验证两个集群正常工作00:09:02
第35讲 修改kafka在zookeeper上的配置目录以及consumer的使用方式00:06:18
第36讲 kafka consumer 剖析00:30:24
第37讲 kafka consumer代码实战00:17:13
第38讲 kafka consumer balance 实战00:18:48
第39讲 实现轮询的producer00:09:27
第40讲 hbase概述和web界面00:19:36
第41讲 hbase架构详解.100:22:06
第42讲 客户端数据读写流程以及zookeeper的作用00:12:46
第43讲 hbase架构详解.200:22:54
第44讲 hbase高可用能力00:15:30
第45讲 hbase data model详解00:20:42
第46讲 数据操作实战.hbase工具功能00:30:33
第47讲 column family的进阶设置实战00:21:01
第48讲 二级索引技术解密00:31:59
第49讲 电商应用的二级索引设计实战00:15:49
第50讲 项目背景概述00:20:07
第51讲 第一版设计及问题分析00:10:51
第52讲 第二版设计及问题分析00:04:40
第53讲 第三版设计及问题分析00:07:12
第54讲 最终设计方案ddi00:07:49| 下载课件
第55讲 hive on hbase概述00:18:36
第56讲 hive on hbase实战.把产品成本表加载到hbase00:14:27
第57讲 phoenix及对比hive on hbase00:15:40
第58讲 phoenix实战.1.通过view映射hbase中的用户表并分析其特点00:20:23
第59讲 phoenix实战.2.通过table映射hbase中的用户表并分析其特点00:05:30
第60讲 phoenix实战.3.通过table映射hbase中的用户表并体会其特点00:08:26
第61讲 项目实战00:13:58
第62讲 hbase事务机制概述00:16:38
第63讲 hbase事务之mvcc详解以及和sql数据库的对比00:22:09
第64讲 hbase物理存储原理解析00:22:34
第65讲 和hbase存储机制有关的一个大坑00:13:46
第66讲 禁用掉自动split后如何维护00:24:15
第67讲 python_hbase开发实战00:23:01
第68讲 python_phoenix开发实战00:14:50
第69讲 项目实战.python_hbase_phoenix_用户行为分析00:29:37
第70讲 kylin概述和工作原理00:24:26
第71讲 数据仓库核心概念00:30:54
第72讲 cub的设计和构建过程00:35:06
第73讲 实时cube的设计和构建00:19:18| 下载课件
第74讲 案例实战00:34:40
第75讲 和传统bi工具的结合00:06:34
第76讲 运维管理00:24:37
第77讲 elk技术栈介绍00:24:11
第78讲 安装配置zookeeper00:03:46
第79讲 安装配置kafka00:05:34
第80讲 验证kafka安装成功00:05:47
第81讲 安装配置filebeat00:10:55
第82讲 验证filebeat配置成功00:04:53
第83讲 配置logstash00:03:05
第84讲 安装配置elasticsearch00:03:13
第85讲 安装配置kibina00:05:25
第86讲 安装ik索引做中文分词00:20:03
第87讲 几个辅助工具的安装演示00:21:34
第88讲 通过restapi操作Elasticsearch的演示00:20:39
第89讲 elasticsearch基本概念(index,type,setting,mapping)00:25:27
第90讲 深入解析mapping.字段类型00:28:50
第91讲 深入解析analyzer00:21:00
第92讲 索引机制详解00:31:18
第93讲 几个高级参数介绍–all、source、store、doc_values00:30:17
第94讲 动态映射00:10:51
第95讲 字段的动态mapping00:15:50
第96讲 字段的动态mapping之dynamic_template00:06:47
第97讲 index template详解00:07:17
第98讲 索引模版和索引别名00:18:48
第99讲 最简单的logstash演示00:10:20| 下载课件
第100讲 实战2.多个输出目标00:05:44
第101讲 实战3.解析日志内容00:11:13
第102讲 实战4.解析json格式日志00:05:12
第103讲 实战5.如何把@timestamp修复成本地时间00:10:28
第104讲 实战6.把logstash收集的数据保存到hdfs00:10:25
第105讲 实战7.如何用access_time替代@timestamp00:07:45
第106讲 实战8.利用插件获取更多的信息00:06:07
第107讲 查询语法总结00:16:18
第108讲 match搜索00:13:03
第109讲 range搜索00:05:35
第110讲 term搜索00:08:16
第111讲 terms进阶用法-关联查询00:10:17
第112讲 exists和not exists00:04:55
第113讲 bool查询00:08:29
第114讲 filter查询00:10:57
第115讲 聚合功能概述以及度量函数说明00:09:51
第116讲 聚合功能概述值度量函数的使用演示00:15:20
第117讲 聚合功能概述之分组聚合函数说明00:09:32
第118讲 聚合功能之分组函数实战之terms实战00:14:23
第119讲 聚合功能之分组函数实战之histgram和range00:10:45
第120讲 聚合同能之分组函数实战之data_histgram00:04:49
第121讲 聚合功能之分组函数实战之filter and filters00:06:45
第122讲 terms分组统计 vs query中的term terms00:18:04
第123讲 向桶中添加统计指标00:05:40
第124讲 桶中桶和联机OLAP