785 B
785 B
checkpoint
分布式快照,应对失败后重新开始
- 批计算是否需要checkpoint?否
- 流计算
- 任务7*24小时运行,重启能够无缝重启
- exactly-once 恰好一次,at-most-once至多一次
- source读取来的数据,必须让整个链路执行成功处理完成才会将state持久化到外部存储(checkpoint)
- source数据源必须支持再次消费
- 必须等到所有的算子处理完才checkpoint,否则at-most-once
- 吞吐量不高,battier(广播分发)栅栏,按批次checkpoint,可能引起重复数据落盘
- 幂等处理id
- checkpoint和mysql事物结合在一起
- source允许再消费,sink幂等或者事务
- 失败后恢复checkpoint快照.
- savepoint->手动checkpoint
- 设置uid,方便代码升级s