最近计划流相关的技术改进, Goldengate到Kafka的连接已经打通, 最近在准备Spark Streaming相关内容, 把计划工作列一下.
0了解阶段--Spark能实现什么内容
0.1 基本的参考文档
官方文档的一些基本的书
0.2 了解Spark相关基本原理
RDD的基本原理
RDD\DataFrame和SparkSQL的区别
0.3 了解重点地sample,主要关注SparkStream这一块
1.准备阶段 --一个基本的可上线使用事例准备
要求: 了解的技术要广(围绕上线要求) 某些要升入
更多的资料参考
全面的功能, 数据库连接等
部署准备
2.上线运维阶段--目标 稳定可靠的系统
环境搭建并部署
监控
定时调度
更多程序的总体运维