前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Flink学习笔记(8) -- Flink Kafka-Connector详解

Flink学习笔记(8) -- Flink Kafka-Connector详解

作者头像
挽风
发布2021-04-13 14:40:39
9600
发布2021-04-13 14:40:39
举报
文章被收录于专栏:小道小道
在这里插入图片描述
在这里插入图片描述

??Kafka中的partition机制和Flink的并行度机制深度结合

??Kafka可以作为Flink的source和sink

??任务失败,通过设置kafka的offset来恢复应用

在这里插入图片描述
在这里插入图片描述

setStartFromGroupOffsets()【默认的消费策略】

代码语言:javascript
复制
	默认读取上次保存的offset信息;
	如果是应用第一次启动,读取不到上次的offset信息,则会根据这个参数auto.offset.reset的值来进行消费数据;
	
	setStartFromSpecificOffsets(Map)
在这里插入图片描述
在这里插入图片描述

setStartFromEarliest()

代码语言:javascript
复制
	从最早的数据开始进行消费,忽略存储的offset信息

setStartFromLatest()

代码语言:javascript
复制
	从最新的数据进行消费,忽略存储的offset信息
在这里插入图片描述
在这里插入图片描述

??当checkpoint机制开启的时候,Kafka Consumer会定期把kafka的offset信息还有其他operator的状态信息一块保存起来。当job失败重启的时候,Flink会从最近一次的checkpoint中进行恢复数据,重新消费kafka中的数据。

??为了能够使用支持容错的kafka Consumer,需要开启checkpoint

代码语言:javascript
复制
	env.enableCheckpointing(5000); // 每5s checkpoint一次
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

??针对job是否开启checkpoint来区分;

??Checkpoint关闭时: 可以通过下面两个参数配置

代码语言:javascript
复制
	enable.auto.commit   设置是否开启自动提交Offset,默认为true
	
	auto.commit.interval.ms  设置自动提交的时间间隔,以毫秒为单位

??Checkpoint开启时:当执行checkpoint的时候才会保存offset,这样保证了kafka的offset和checkpoint的状态偏移量保持一致。

代码语言:javascript
复制
	可以通过这个参数设置setCommitOffsetsOnCheckpoints(boolean),这个参数默认就是true。表示在checkpoint的时候提交offset,
此时,kafka中的自动提交机制就会被忽略
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

??如果Flink开启了checkpoint,针对FlinkKafkaProducer09 和FlinkKafkaProducer010 可以提供 at-least-once的语义,还需要配置下面两个参数:

代码语言:javascript
复制
setLogFailuresOnly(false)
setFlushOnCheckpoint(true)

注意:建议修改kafka 生产者的重试次数
	  retries【这个参数的值默认是0】
在这里插入图片描述
在这里插入图片描述

??如果Flink开启了checkpoint,针对FlinkKafkaProducer011 就可以提供 exactly-once的语义,但是需要选择具体的语义:

代码语言:javascript
复制
	Semantic.NONE
	Semantic.AT_LEAST_ONCE【默认】
	Semantic.EXACTLY_ONCE

	注意:在这里我们使用的kafka是基于0.11这个版本,如果是低版本的话,有一些新特性是不支持的。具体的可以参考官方文档
	https://ci.apache.org/projects/flink/flink-docs-release-1.6/dev/connectors/kafka.html
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
本文参与?腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019-12-31 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客?前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与?腾讯云自媒体同步曝光计划? ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
大数据
全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
http://www.vxiaotou.com