Kafka - 기초 -

1 minute read

고성능 TCP 네트워크 프로토콜을 통해 통신하는 서버와 클라이언트로 구성된 분산시스템으로 분산형 스트리밍 플랫폼

/assets/images/kafka/partitionsKafka.png

주요 개념

event: [key, value, timestamp, optional metadata headers]로 구성되어 있음

broker: kafka 서버를 의미하며, 한 클러스터에 여러 Kafka 서버를 띄울 수 있음

producer: Kafka에 event를 게시(등록)하는 주체

consumer: event를 구독하는 클라이언트로 해당 event를 읽고 처리함

topic: 파일 시스템의 폴더와 유사하며 event들을 구성하는 곳

partition: 하나의 topic 내에 분산 저장되는 곳으로 여러 partition이 존재 할 수 있으며, 하나의 partition내에서는 Queue 구조로 처리하여 순서를 보장해주지만, partition끼리는 순서를 보장해주지 않음

/assets/images/kafka/streams-and-tables-p1_p4.png

/assets/images/kafka/producer.png

세부적으로 Consumer Group과 Consumer Instance로 나뉜다.
Consumer Group은 각 Consumer Instance의 그룹들을 의미하며 각 Consumer Instance가 처리한 정보(Offset)을 통해 관리한다.
Consumer Instance는 실질적으로 이벤트를 소비하는 주체이다.
Consumer Group은 하나의 토픽에 접근 가능하다.
Consumer Instance는 토픽 내 소비해야할 파티션의 Offset을 Consumer Group에게 공유하며 소비한다.
Consumer Instance가 일련의 토픽을 구독하며(pull) 할당된 파티션에서 지속적으로 수신한다. 일정 기간동안 heartbeat을 보내지 않으면 죽은 것으로 간주되어 할당된 파티션이 재 할당 된다.

/assets/images/kafka/consumer-group.png

/assets/images/kafka/consume.png

/assets/images/kafka/topic-replication.png