003: Gửi và nhận message trong Apache Kafka

--- tags: Apache Kafka --- # 003: Gửi và nhận message trong Apache Kafka Bài viết nằm trong series [Apache Kafka từ zero đến one](https://hackmd.io/@datbv/S1Nhe2sJt). Cùng tìm hiểu về cách gửi nhận message trong Kafka và trả lời các câu hỏi phần trước: > - Nếu muốn các message được lưu trên cùng một **partition** để đảm bảo thứ tự thì làm cách nào? > - Một **partition** có nhiều **replication** thì việc read/write message diễn ra trên **replication** nào hay tất cả các **replication**? ## 1) Leader partition concept Với **replication factor**, mỗi **partition** được replicate thành nhiều **replication** lưu trữ trên các **broker** khác nhau để đảm bảo **high reliable** và **high durable**. ![](https://i.imgur.com/lVjvJ26.png) Có thể hình dung các **replication** của một **topic** là một dev team. Mỗi khi có thêm feature mới, có 2 cách để team quyết định implement luôn không: > - **Thứ nhất, cả team cùng vote**: cách này khá fair nhưng mất thời gian. Mỗi khi có feature mới lại họp hành biểu quyết - **Peer-to-Peer**. > - **Thứ hai, bầu ra leader quyết định thay cho cả team**: cách này phụ thuộc vào leader nhưng không mất thời gian họp hành. Ông leader nghỉ việc thì bầu ông khác lên thay - **Leader - Follower** Để đảm bảo yếu tố **performance** và tránh rắc rối khi đồng bộ message giữa các **replication**, Kafka lựa chọn implement theo hướng **Leader - Follower**, chỉ định một và chỉ một **replication** bất kì làm **leader**. > Không chỉ riêng Kafka mà khá nhiều các hệ thống khác đều áp dụng mô hình **Leader - Follower**. Như vậy, tất cả các thao tác read/write message của **partition** đều thông qua **replication leader**: > - Tại một thời điểm, mỗi **partition** có duy nhất một **replication leader**. > - Chỉ có thể read/write message từ **replication leader**. > - Các **replication** còn lại được gọi là **ISR**, đồng bộ message từ **replication leader**. > - Do vậy, mỗi **partition** có duy nhất một **replication leader** và một hoặc nhiều **ISR** - **in-sync replica**. ![](https://i.imgur.com/60roMqs.png) Trong trường hợp **Broker 101** gặp sự cố, **replication leader** của **partition 1** không còn hoạt động. Lúc này, một trong các **ISR** còn lại sẽ trở thành **Leader** và **partition** trở lại hoạt động bình thường. Một câu hỏi khác được đặt ra - Ai là người quyết định **replication** nào trở thành **Leader** hay **ISR**? > Đó là nhiệm vụ của **ZooKeeper**. Nó làm thế nào, sử dụng thuật toán gì, đón chờ phần sau nhé. ## 2) Producer ### 2.1) Producer **Producer** là người gửi message đến **Message broker**. Cụ thể với Kafka, **producer** write data vào **partition** của **topic**. **Producer** tự động biết nên write vào **broker** nào và **partition** nào. Trong trường hợp đang write data mà **broker** gặp sự cố, **producer** sẽ có cơ chế tự động retry cho đến khi thành công. ![](https://i.imgur.com/oLRNkbf.png) Nghe không ổn lắm, nếu **producer** tự assign các message vào **partition** thì làm cách nào đầu nhận có thể lấy đúng message? Trong trường hợp gửi message đến **topic** mà không chỉ định **partition**, **producer** sẽ gửi message đến **broker** theo cơ chế **round-robin**. > Nghĩa là message đầu tiên đi vào **broker 101**, message thứ hai đi vào **broker 102**, message tiếp theo đi vào **broker 103**... cứ như vậy, các message được write balance giữa các **broker**. Tiếp tục đến bài toán khác, làm thế nào **producer** biết message đã được write thành công ở **partition**? Chẳng cách nào khác ngoài cơ chế **ack** - acknowledgment. **Producer** có thể lựa chọn nhận ack từ **Kafka** để chắc chắn rằng message được gửi thành công: > - **acks=0**: giống fire-and-forget, gửi message mà không chờ phản hồi. Do vậy có thể dẫn đến tình huống mất message. > - **acks=1**: default setting. Lần này chắc chắn hơn, **producer** chờ cho tới khi nhận được phản hồi từ **replication leader**. Tuy nhiên chưa ngăn chặn hoàn toàn việc mất message. **Replication leader** write message thành công, báo lại cho **producer**, tuy nhiên **broker** có thể gặp sự cố với **disk**, không thể khôi phục data. > - **acks=all**: lần này thì quá chắc chắn, đảm bảo không mất message. **Producer** sẽ nhận được phản hồi khi tất cả **replication leader** và **IRS** write data thành công. > > Dễ dàng nhận thấy cái giá phải trả cho việc đảm bảo không mất message là performance. ### 2.2) Message key Làm thế nào để điều hướng message đến chính xác **partition** mình mong muốn để đảm bảo message ordering? > - Câu trả lời là.. có thể đảm bảo message ordering, nhưng để điều hướng đến chính xác **partition** mong muốn thì hơi khó - Kafka sẽ xử lý việc này cho chúng ta. Nếu muốn các message liên quan với nhau được gửi vào cùng **partition** và order theo thứ tự, cần define **key** cho mỗi message. > - **Key** có thể là bất kì loại dữ liệu nào: string, number... > - Nếu **key = null**, message được gửi đến **broker**/**partition** theo cơ chế round-robin. > - Nếu **key != null**, tất cả các message có cùng **key** sẽ đi vào cùng **broker**/**partition**. > > Có thể coi **key** là tấm thẻ bài phân luồng của message. Nếu bạn không có thẻ bài, tôi sẽ điều hướng bạn đến bất kì đâu. Ngược lại, tôi sẽ kiểm tra và tìm đúng luồng cho bạn. Quay lại ví dụ Grab bài trước, không cần quan tâm thứ tự gửi giữa nhiều tài xế, chỉ cần đảm bảo message của từng tài xế đúng thứ tự. Vậy, có thể sử dụng **driver_id** làm message key. > - Toàn bộ message của **driver_007** có thể đi vào **partition 0** hoặc **partition 1**. > - Toàn bộ message của **driver_009** có thể đi vào **partition 1** hoặc **partition 0**. > > Không cần quá quan tâm message thực sự đi vào **partition** nào. Chỉ cần biết cùng **message key** sẽ vào cùng **partition**. Kafka sử dụng các thuật toán hashing và rounting để điều phối message có cùng **key** đến cùng **partition**. Chúng ta hoàn toàn có khả năng điều phối message đến chính xác **partition** mong muốn bằng cách đọc code Kafka, tuy nhiên nó chẳng giúp giải quyết vấn đề gì. Chốt, với **producer** có 3 thứ cần quan tâm và ghi nhớ: > - Ackowledgement. > - Round-robin. > - Message key. ## 3) Consumer ### 3.1) Consumer Có gửi thì có nhận, và **consumer** là đầu nhận message. > - **Consumer** đọc message từ **topic**, xác định bằng topic name. > - Đồng thời, **consumer** biết nên đọc message từ **broker** nào. Trong trường hợp chưa read xong mà **broker** gặp sự cố, **consumer** cũng có cơ chế tự phục hồi. > - Việc đọc message trong một **partition** diễn ra tuần tự để đảm bảo message ordering. Có nghĩa là **consumer** không thể đọc message **offset=3** khi chưa đọc message **offset=2**. > - Một **consumer** cũng có thể đọc message từ một hoặc nhiều hoặc tất cả **partition** trong một **topic**. ![](https://i.imgur.com/TzdKEIn.png) Quan trọng nên cần nhắc đi nhắc lại: > - Message ordering chỉ đảm bảo trong một **partition**. Việc đọc ghi message giữa nhiều **partition** không đảm bảo thứ tự. > - Message offset=5 ở **partition 0** có thể được đọc trước message offset=2 ở **partition 1**. ### 3.2) Consumer group Đã có **consumer** lại mọc thêm **consumer group**. Vậy **consumer group** là gì và giải quyết vấn đề gì? > Quay lại phần trước, **consumer** là nơi đọc message từ **topic**. Có nghĩa là một **consumer** có thể đọc toàn bộ message của tất cả **partition** thuộc cùng **topic**. > > Nếu số lượng **producer** tăng lên và đồng thời gửi message đến tất cả **partition** trong khi chỉ có duy nhất một **consumer** thì khả năng xử lý sẽ rất chậm, có thể dẫn tới **bottle-neck**. Giải pháp là tăng số lượng **consumer**, các **consumer** có thể xử lý đồng thời message từ nhiều **partition**. Và tất cả các **consumer** sẽ thuộc cùng một nhóm được gọi là **consumer group**. Như vậy, **consumer group** read toàn bộ data của các **partition** và chia vào các **consumer** bên trong để xử lý. Mỗi **consumer** thuộc **consumer group** sẽ đọc toàn bộ data của một hoặc nhiều **partition** để đảm bảo message ordering. Không tồn tại nhiều **consumer** cùng đọc message từ một **partition**. ![](https://i.imgur.com/nUKzlKa.png) Một **consumer** có thể nhận message từ nhiều **partition**. Nhưng một **partition** không thể gửi message cho nhiều **consumer** trong cùng **consumer group**. ![](https://i.imgur.com/m8kQHt7.png) Nếu số lượng **consumer** trong **consumer group** lớn hơn số lượng **partition** thì những **consumer** dư thừa có trạng thái **inactive** - không nhận bất kì message nào từ **topic**. ![](https://i.imgur.com/wPfWHdI.png) Có vẻ vô nghĩa nhưng một vài trường hợp số lượng **consumer** trong **group** sẽ lớn hơn số lượng **partition**. > Trong trường hợp một **active consumer** gặp vấn đề và không thể tiếp tục hoạt động, một trong những **inactive consumer** còn lại được đẩy lên thay thế và tiếp tục công việc ngay lập tức. > > Nếu không có **inactive consumer** nào, message sẽ được route tới một **active consumer** bất kì khác. > > Quá trình re-assign này được gọi là **partition rebalance**. Chia thành càng nhiều **partition** và càng nhiều **consumer** thì số lượng message được xử lý đồng thời càng nhiều, phần nào cải thiện **performance** của hệ thống. > - Từ **1 partition/1 consumer** thành **5 partition/5 consumer** khả năng sẽ đem lại performance tốt. > - Nhưng lên **1000 partition/1000 consumer** thì chưa chắc. ## 4) Queue và Topic trong Apache Kafka Như vậy chúng ta đã đi qua các thành phần quan trọng của Kafka, từ việc lưu trữ message với **offset**, **partition**, **replication**, **topic**, **broker** cho đến gửi nhận message với **producer** và **consumer**. Phần cuối cùng trong bài sẽ nói về cách implement **queue** và **topic** với Kafka: > - Point-to-point messaging - Queue. > - Broadcast messaging - Topic. Thực ra nó đã lồ lộ ở phần **consumer group**, chỉ là chúng ta có nhận ra hay không. > - Nếu một **topic** có duy nhất một **consumer group**, nó là **point-to-point messaging - queue**. > - Ngược lại nếu muốn implement hệ thống **broadcast messaging - topic**, hãy tạo ra nhiều **consumer group** subcribe trên cùng một topic. ![](https://i.imgur.com/xvEKSw8.png) ### Reference - https://hackmd.io/@datbv/S1Nhe2sJt#Reference © [Dat Bui](https://www.linkedin.com/in/datbv/)