初识 Flink
更新日期:
这两天看了InfoQ网站上 “Apache Flink 零基础入门” 系统文章,学了点皮毛, 记录一下。
安装Flink
最简单的方法还是从官网下载二进制,解压之后就可以使用了。刚开始还打算从源代码编译,但遇到包下载不成,折腾了两天的空闲时间还是放弃了。 下载连接 https://flink.apache.org/zh/downloads.html
启动、停止
Flink支持单机集群Standalone, 多机集群及基于 Yarn 调度系统。 个人测试使用Standalone, 如下命令启动后,浏览器访问 http://localhost:8081
|
|
停止集群使用如下命令:
|
|
JobManager/TaskManager
Flink 在架构上分为 JobManager与TaskManager, JobManager 是任务的控制者,TaskManager 是执行任务的worker, 都是一个JVM. TaskManager 中运行的单位为Task slot, 相当于一个线程。 一个TM默认只有一个task slot, 可以通过修改配置文件conf/flink-conf.yaml
中的配置来设置Task slot个数。修改Task slot个数时, savepoint的路径也需要配置, 因为修改job的并发度时要先在savepoint保存状态,在重新调度。
|
|
如果命令来修改并发度(使用task slot个数):
|
|
下一步
现在只体验了命令行, 还没有自己写代码。 下一步希望自己实现flink简单任务,与kafka connector集成,然后深入了解window, extact-once语义。