paint-brush
Kafka против RabbitMQ: найдите лучший вариант для вашего проектак@berdysheva
1,794 чтения
1,794 чтения

Kafka против RabbitMQ: найдите лучший вариант для вашего проекта

к Mariia Berdysheva8m2024/06/19
Read on Terminal Reader
Read this story w/o Javascript

Слишком долго; Читать

Kafka и RabbitMQ — отличные инструменты для сценариев с высокой пропускной способностью и низкой задержкой. Выбор зависит от особенностей варианта использования, архитектуры и будущих требований. Например, Kafka идеально подходит для долгосрочного хранения событий транзакций, а RabbitMQ отлично подходит для сценариев, требующих совместимости протоколов и гибкости маршрутизации. Когда и RabbitMQ, и Kafka подходят, подумайте о своих будущих потребностях.

Companies Mentioned

Mention Thumbnail
Mention Thumbnail
featured image - Kafka против RabbitMQ: найдите лучший вариант для вашего проекта
Mariia Berdysheva HackerNoon profile picture
0-item


В распределенных системах и микросервисах брокеры сообщений играют важную роль. Они обеспечивают асинхронную связь, разделяют сервисы и повышают надежность и масштабируемость. Современная архитектура в значительной степени зависит от брокеров сообщений, что делает их ключевым компонентом во многих шаблонах проектирования.


Kafka и RabbitMQ — два самых популярных брокера сообщений. Они известны своей надежностью, эффективностью и адаптивностью, отличной документацией, поддержкой и сообществами.


RabbitMQ — это бесплатное решение с открытым исходным кодом, имеющее двойную лицензию Apache License 2.0 и Mozilla Public License 2. Оно позволяет использовать и изменять его по мере необходимости. Оно функционирует как чистый брокер сообщений, поддерживая несколько протоколов и предлагая дополнительные функции.


Kafka, также с открытым исходным кодом под лицензией Apache 2.0, — это больше, чем просто брокер сообщений; это распределенная платформа потоковой передачи событий. Она предоставляет расширенные функции, включая Kafka Streams.


При сравнении RabbitMQ и Kafka не существует «лучшего» решения; речь идет о поиске наиболее подходящего для вашей архитектуры и целей решения.


Эта статья проведет вас через ключевые функции и характеристики, сравнивая их напрямую. Она направлена на то, чтобы предоставить всестороннее понимание различий между Kafka и RabbitMQ, помогая вам сделать осознанный выбор на основе вашей конкретной проблемы и требований.


Поддержка протоколов

RabbitMQ поддерживает различные протоколы, такие как:

  1. MQTT (MQ Telemetry Transport) — это легкий протокол для сетей с ограниченной пропускной способностью и высокой задержкой, таких как в Интернете вещей (IoT). Первоначально созданный для мониторинга нефтепроводов, теперь он широко используется как протокол обмена сообщениями типа «издатель-подписчик».
  2. STOMP (Simple Text Oriented Messaging Protocol) — это простой и легкий текстовый протокол для интеграции обмена сообщениями, хорошо подходящий для использования через WebSocket и Интернет.
  3. AMQP (Advanced Message Queuing Protocol) — это основной протокол для RabbitMQ, в котором подробно описываются различные варианты маршрутизации. Хотя RabbitMQ может поддерживать другие протоколы через плагины, AMQP — его основной протокол.


С другой стороны, Kafka использует свой двоичный протокол на основе TCP, оптимизированный для высокой пропускной способности, и полагается на абстракцию «набора сообщений». Эта абстракция позволяет сетевым запросам группировать сообщения вместе, сокращая накладные расходы на сетевые циклы за счет отправки пакетов вместо отдельных сообщений. Пользовательский протокол Kafka обеспечивает гибкость в разработке и оптимизации для сценариев с высокой нагрузкой.


Однако у пользовательского протокола есть и недостатки. Он изолирует Kafka от других брокеров сообщений, что приводит к отсутствию взаимодействия. В отличие от RabbitMQ, который совместим с любым клиентом AMQP, Kafka требует использования клиентов Kafka. Тем не менее, благодаря популярности Kafka и усилиям сообщества, клиенты Kafka доступны для многих языков программирования.

Маршрутизация

Подходы к маршрутизации в RabbitMQ и Kafka существенно различаются.

Маршрутизация RabbitMQ

Основные компоненты маршрутизации RabbitMQ:

  • Производитель. Приложение, которое генерирует и отправляет сообщения в RabbitMQ.
  • Обмен. Получает сообщения от Производителя и направляет их в одну или несколько очередей.
  • Очередь. Хранит сообщения.
  • Потребитель. Приложение, которое подписывается на очередь и получает сообщения из нее. RabbitMQ отправляет сообщения Потребителю , и каждый Потребитель получает сообщения только из одной очереди.

RabbitMQ
Прежде чем углубляться в тему бирж, следует прояснить еще два понятия:

  1. Привязка. Правило описывает, как направлять сообщения из Exchange в Queue. Обычно Consumer привязывает Queue к определенному Exchange при его создании.
  2. Ключ маршрутизации. В RabbitMQ производитель не может напрямую указать очередь для сообщения. Exchange маршрутизирует сообщения на основе ключа маршрутизации, предоставленного производителем, который состоит из одной или нескольких строк, разделенных точками.


Существует четыре типа обмена:

  1. По умолчанию. Направляет сообщения напрямую в очередь, используя имя очереди из ключа маршрутизации.
  2. Разветвление. Рассылает сообщения всем связанным очередям, игнорируя ключ маршрутизации.
  3. Прямой. Направляет сообщения в очереди на основе точного соответствия между ключом маршрутизации и ключом привязки, предоставленным очередью.
  4. Тема. Позволяет использовать сложные правила маршрутизации на основе сопоставления шаблонов ключа маршрутизации, поддерживая подстановочные знаки:
  • *(звездочка) соответствует ровно одному слову.

  • #(хеш) соответствует нулю или более слов.


Например, очередь, связанная с ключом маршрутизации "apple.*.banana", будет получать сообщения с ключами типа "apple.orange.banana" или "apple.strawberry.banana" . Очередь, связанная с #.banana, будет получать сообщения с ключами типа "apple.banana" или "apple.orange.banana".


Кафка

Маршрутизация Кафки проще. Основные компоненты:

  • Производитель. Подобно RabbitMQ, он отправляет сообщения в тему.
  • Тема. Хранит сообщения. Производители указывают тему, в которую они отправляют сообщения.
  • Разделы. Каждая тема делится на разделы, представляющие физическое хранилище сообщений. Производители могут указать ключ для маршрутизации сообщений, гарантируя, что все сообщения с одним и тем же ключом принадлежат одному разделу.
  • Потребитель. В отличие от Потребителей RabbitMQ, Потребители Kafka извлекают сообщения из Тем . Они могут читать сообщения только из одной Темы за раз.

Кафка

По сравнению с RabbitMQ возможности маршрутизации Kafka ограничены. Он не предназначен для гранулярной маршрутизации, а для высокой производительности и масштабирования.


Здесь следует отметить одну важную вещь:


В RabbitMQ, когда Потребитель получает сообщение из Очереди, он «крадет» его. Если подтверждение успешно получено, другие Потребители не получат сообщение. Потребители Kafka ведут себя так же, если они находятся в одной и той же Группе Потребителей. Группа Потребителей — это абстракция Kafka, которая позволяет нескольким Потребителям читать из одной и той же Темы независимо, гарантируя, что каждая Группа Потребителей обрабатывает все сообщения Темы.

Стойкость и долговечность

В RabbitMQ долговечность и устойчивость являются отдельными характеристиками:


  • Долговечность. Это свойство очередей и обменов. Существует два типа очередей: прочные и временные. Прочная очередь (или обмен) хранит свои метаданные на диске и может пережить перезапуск брокера. Временные очереди этого не делают.

  • Сохранение. Устойчивая очередь не гарантирует сохранность сообщения. Чтобы сделать ее устойчивой, необходимо настроить сохранение. Когда издатель отправляет сообщение, он может указать свойство сохранения. В этом случае сообщение будет сохранено во внутреннем дисковом хранилище и будет доступно после перезапуска брокера.


Kafka хранит все на диске. В отличие от RabbitMQ, который удаляет сообщения после подтверждения Consumer, Kafka сохраняет все сообщения до тех пор, пока они не достигнут предела времени жизни (TTL) или размера диска. Это позволяет повторно обрабатывать сообщения другой или той же Consumer Group.

Масштабируемость

И RabbitMQ, и Kafka поддерживают кластеризацию, при которой несколько брокеров работают вместе.


В RabbitMQ кластеризация улучшает доступность и обеспечивает безопасность данных. Если говорить о производительности, то вертикальное масштабирование является предпочтительным способом повышения производительности RabbitMQ. Горизонтальное масштабирование может добавить значительные накладные расходы на синхронизацию. Обычно вы бы предпочли иметь кластер из 3 брокеров, чтобы обеспечить доступность в случае отказа одного брокера.


RabbitMQ не поддерживает разделение очередей по умолчанию, но стоит отметить, что оно у него есть. плагин для последовательного обмена хэшами , что может помочь вам с масштабированием и равномерным распределением нагрузки по кластеру.


Kafka эффективно масштабируется. Он не только обеспечивает доступность и безопасность данных, но и повышает производительность обработки данных. Ключевая концепция здесь — разбиение на разделы. Каждая тема имеет настраиваемое количество разделов. Каждый раздел работает изолированно от других, выступая в качестве физического хранилища и обработки данных. Вы можете реплицировать каждый раздел по всему кластеру, что обеспечивает отказоустойчивость. Производители и потребители работают только с основным (или первичным) разделом. Если брокер с этим разделом выходит из строя, система выбирает новый первичный раздел из реплик.


Выбор правильного количества разделов имеет решающее значение. Большое количество разделов замедляет восстановление системы в случае отказа узла. И наоборот, это ограничивает пропускную способность и уровень параллелизма для группы потребителей. В пределах одной группы потребителей каждый раздел может работать только с одним потребителем (что фактически является одним потоком в вашем приложении). Поэтому наличие трех разделов не имеет смысла, если у вас больше трех потребителей, поскольку остальные будут простаивать.


тема Кафки


Заказ

RabbitMQ гарантирует упорядочение в пределах одной очереди. Один потребитель будет обрабатывать сообщения по порядку. Однако ситуация меняется с несколькими потребителями. Если один потребитель выходит из строя, система возвращает неподтвержденные сообщения в очередь, но следующий потребитель может уже обрабатывать следующую партию. Итак, какие есть варианты?


  1. Используйте Kafka! Kafka гарантирует упорядочение в пределах одного раздела (он интуитивно понятен, поскольку может работать с одним разделом за раз). Однако Kafka не гарантирует упорядочение для всей темы. Обычно важно поддерживать порядок в пределах идентификатора клиента или идентификатора платежа. Поэтому, если производитель использует правильный ключ раздела, вы можете добиться точного упорядочения для своей системы.
  2. Использовать плагин для последовательного обмена хэшами . С опцией Single-Active Consumer он преобразует RabbitMQ в Kafka. Он дает вам «разделы» и гарантирует, что только один потребитель может работать с каждым разделом.

Гарантии доставки

RabbitMQ и Kafka предоставляют гарантии доставки «по крайней мере один раз», то есть дубликаты возможны, но сообщения будут полностью обработаны по крайней мере один раз.


У Kafka есть дополнительные возможности доставки:

  • Идемпотентный производитель. В Kafka вы можете настроить своего производителя для замены дублирующихся сообщений. RabbitMQ Producer может отправлять дубликаты в очередь.
  • Доставка exactly-only в рамках обработки Kafka. exact once - самая сильная гарантия. Она гарантирует, что каждое сообщение будет обработано только один раз, не больше и не меньше. В Kafka вы можете получить это с помощью транзакции Kafka: когда вы потребляете из одной темы Kafka и пишете в другую тему Kafka.

Дополнительные возможности

Как уже упоминалось ранее, отказываясь от гибкости маршрутизации, Kafka взамен приносит мощные функции.


Kafka предлагает мощные библиотеки потоковой обработки:

  • Kafka Streams. Позволяет обрабатывать и преобразовывать данные в режиме реального времени в Kafka.
  • KSQL. Предоставляет SQL-подобный интерфейс для запроса и преобразования потоковых данных, создавая надежные абстракции таблиц, поддерживаемые темами Kafka.


С помощью Kafka Streams вы можете выполнять агрегацию данных по времени по вашей теме и передавать результаты в другую тему или базу данных.


Предположим, у вас есть тема с курсами обмена валют по разным валютным парам, и вы хотите объединить данные графика открытия-максимума-минимума-закрытия (также OHLC) за определенные периоды времени (5 минут, 30 минут, 1 час и т. д.).


Один из вариантов — хранить данные в базе данных временных рядов, которая подходит для такой обработки. Однако, если у вас есть Kafka, это вам не нужно. Используя простые агрегации Kafka Stream, вы можете вычислять данные OHLC поверх темы Kafka и помещать результаты в любую базу данных для дальнейшего запроса.


Kafka также позволяет вам представлять обработанные сообщения в виде таблицы. Он помещает результаты агрегации в абстракцию таблицы, к которой вы можете получить доступ через KSQL. Такое состояние таблицы является долговечным. Если брокер перезапустится, он восстановит последнее состояние из соответствующей темы.


Как мы видим, Kafka выходит за рамки базовой функциональности брокера сообщений и вступает на территорию обработки в реальном времени и ETL.

Заключение

Kafka и RabbitMQ — отличные инструменты для сценариев с высокой пропускной способностью и низкой задержкой. Выбор зависит от особенностей варианта использования, архитектуры и будущих требований. Например, Kafka идеально подходит для долгосрочного хранения событий транзакций, тогда как RabbitMQ отлично подходит для сценариев, требующих совместимости протоколов и гибкости маршрутизации. Когда и RabbitMQ, и Kafka подходят, подумайте о своих будущих потребностях.