V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
akmonde
V2EX  ›  Kafka

kafka 多线程消费是否必须手动提交 offset/partion 才能避免竞争

  •  
  •   akmonde · Jul 27, 2021 · 2284 views
    This topic created in 1741 days ago, the information mentioned may be changed or developed.

    rt,我这边遇到个问题,需要 kafka 多线程消费数据。

    已知同一个 groupid,能控制多个消费者竞争问题,不会出现同一条数据被多个消费者重复读取。

    但是多个线程同时去读,是否必须手动提交 offset,auto_commit 不知道能否满足要求?

    我在网上看到的 case,基本上是让本地建个临时 sqlite 库,根据 partion 和线程对应去消费,手动提交 offset 。

    比如:https://www.cnblogs.com/lshan/p/11647485.html

    我不知道最佳实践是怎样的?

    各位大佬,很急在线等!

    5 replies    2021-07-28 20:20:36 +08:00
    billlee
        1
    billlee  
       Jul 28, 2021
    每个 partition 只能被一个线程读取。自动提交 offset 只对非正常退出时丢数据有影响。
    akmonde
        2
    akmonde  
    OP
       Jul 28, 2021
    @billlee 嗨,大佬,那我之前提出的记录 offset 和 partion 有必要么,还是每次手动提交 offset 就行。
    JKeita
        3
    JKeita  
       Jul 28, 2021
    一个消费者多个线程?不同线程对应一个分区?这种应该只能手动控制了吧
    akmonde
        4
    akmonde  
    OP
       Jul 28, 2021
    @JKeita 我就在琢磨,要是每次手动控制 offset,那每个 partion 的初始的 offset 咋设置?也不能 auto_offset_reset 每个都设置 0-100 随机来个?
    billlee
        5
    billlee  
       Jul 28, 2021
    @akmonde 就是两个模式嘛。如果用 kafka 提供的 commit 功能,不管是手动 commit 还是自动 commit,就不需要自己记录。如果自己维护,就要自己分配那个线程读取哪些 partition, 并做好 partitition id 和 offset 的记录。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   882 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 34ms · UTC 19:02 · PVG 03:02 · LAX 12:02 · JFK 15:02
    ♥ Do have faith in what you're doing.