最近在学习 kafka-stream,也在看 Kafka Streams 实战,有几个关于拓扑的疑问
拓扑中产生了 change-log 结尾的分区,查了很多资料是说和状态存储有关系,这个 topic 对集群流量会有什么影响,如果没有会怎么样
我的理解是 change-log 只会保存最后一次状态,重启 stream 时候本地会从 change-log 恢复状态,不过这样就很难估算 kafka 集群流量了
最后吐槽下 kafka stream 相关书籍实在太少,外网资料也是,可能从 spark 学起更好?