��/��/��ţ

��

ϵͳ��Kafka��ͱ��

��Դ��infoqMichael Noll

��̽��Kafka�洢��ʹ��Ļ��ϵ��µĵ��ƪ��ڶ�ƪ��Kafka�Ĵ洢�㣺��⡢��ʹ��Լ��洢��ʽ�ͷ��ơ��ƪ��У��ǽ��ͱ��Լ��Ⱥ�飬�Լ��ͨ��Щ��ʵ�ִ��ģ��ݲ��д��

��ȴӴ洢��е��¼��ʼ��η��Щ�¼��ת��ͱ��

�Ӵ洢��¼��

��λ�ڴ洢�㣬��Kafka��ļ�ϵͳ��һ��֡��෴��ͱ��Kafka��Ķ��ksqlDB��Kafka Streams��õ��ͱ��Щ��߽��ԭʼ��е��¼�ת��ͱ��ϵ��ݿ⽫��ļ��ֽ�ת��ݿ��һ��

ͼ1. ��λ�ڴ洢�㣬��ͱ�λ�ڴ��

��Kafka�У��¼��Ǵ��schema��⡣�¼��ļ��ֵ��ֽ��飬��Ǿ��о��ͣ��Ϳ��֪��ʲô��һ��Ҳ��û�б߽�ġ�

��ʾ��ʹ��<eventKey, eventValue>��ʾ�¼��ļ��ֵ��磬<byte[], String>��ʾ�¼��ļ��ֽ��飬�¼��ֵ��һ��ַ��Ҳ��ʹ�ø�Ϊ��ӵ��ͣ��Avro schema�ж��GeoLocation��͡�

ʾ��1��<byte[], byte[]>��͵��ⱻ��߿ͻ��˷��л�Ϊ<String, String>��͵��¼��ߣ��Ҳ��ʹ�ø�Ϊ��ͣ��<User, GeoLocation>��Ҹ��ѡ��͡�

��ǽ��תΪ��ʾ��룺

ksqlDB��https://gist.github.com/confluentgist/2e9f37db0d9810044f6836f48b267fcd
Kafka Streams��https://gist.github.com/confluentgist/c26c68f18959d1ee8a18a8ac94333d0c

��Ҳ��ͨ��ϵı��Kafka�У��RDBMS�е��ﻯ��ͼ��¼��һ��Ҳ�Ǿۺϵ��

��Ȼ��Ҳ��ֱ�ӻ��ʵ�ʵ��У��б߽�ģ�Ҳ��˵��޵ģ��Ϊһ��˾�Ŀͻ��޵ģ��˾��Ʒ��޵ġ��Ҳ��ޱ߽�ģ��磬��ǳ��ϵ��һ��м��У��¼��ÿһ�еļ��һ��UUID��

ʾ��2��<String, String>��͵��¼��ۺϳ�һ��<String, String>��͵ı��׷��û�λ�á��ʾ��ͼ1��ʾ��

��ǽ��תΪ��ʾ��룺

ksqlDB��https://gist.github.com/confluentgist/450505b3c4d08c6c641d272d63234349
Kafka Streams��https://gist.github.com/confluentgist/3b25acf0d1d723dfcdacc7f00e23f296

ʾ��3��<String, String>��͵��ۺϳ�<String, Long>��͵ı��׷��û��ʹ��λ�õ��ۺϲ��ϵؼ��λ��±��

��Լ��schema

֮ǰ�Ѿ�˵��߿ͻ��˻��ĳ��schema��Kafka��Ϣ��ԭʼ�ֽڷ��л��¼��schema��ʽ��Avro��Protobuf��Ҳ��Ƿ��ʽ��JSON��ʽ��

��ǣ�һ��߿ͻ��ô֪��η��л��¼��Ϊ�¼�ͨ��ɲ�ͬ�Ŀͻ��ɵġ��ǣ��ߺ��߱��ĳ��Լ��Gwen Shapira֮ǰд��һƪ��£��Լ��schema��Ͳ��ˡ��ܵ��˵��򵥵İ취��ʹ��Avro��Confluent Schema Registry��

Confluent Platform 5.4��ϰ汾֧��ڴ��˽��м��ʽ��schema��֤��ͻ��˾Ͳ��Υ��Լ��ڽ��¼��浽��֮ǰ��֤��

��Ҳ�Ƿ��

��Kafka���Ҳ�Ƿ��ģ��洢��ǰ��ģ��ַ�ʽҲ��ͱ��Ĵ��Ϊ�˸��õ��ִ��ƣ��Ҫ��˽�Kafka��Ⱥ��

Kafka֧�ִ��ģ��ݲ��д��д��ͨ��д��ֲ�ʽӦ�ó��ʵ��ʵ�ֵġ�

��ЩӦ�ó��ʵ��Ҫ��̬��Kafka��Ⱥ�飬ͨ��Э��ķ�ʽ��ȡͬһ��ݡ��Kafka StreamsӦ�ó��У�Ⱥ��ĳ�Ա��ϵ��ͨ��application.id��õģ��ksqlDB��Ⱥ�У��Ա��ϵ��ͨ��ksql.service.id��õģ��Kafka��߿ͻ��У��Ա��ϵ��ͨ��group.id��õġ�

��ǿ��һ��Kafka Streams�ֲ�ʽ��թ��Ӧ�ó��ڲ��д��payments��ĺ��ݣ��Ӧ�ó��ʵ��fraud-detection-appȺ�顣Ӧ�ó��Kafka��Ⱥ��һ��ͨ��ȡ��д��¼��

ͼ2. ��ֲ�ʽӦ�ó��ʵ��һ��Kafka��Ⱥ�顣��ǹ�ͬЭ��д��ݡ�

��һ��Ⱥ��У�ÿ��ʵ��ֵ�һ��ݣ�һ��֮��Ƕ��ġ�Kafka��Ⱥ��Э��Զ��Ƿ��µ��߼��Ⱥ��Ƿ��뿪Ⱥ�飬Ȼ��Զ��·��为�غͷ��Ϳ��Լ��ݡ�

��Kafka�У��Э��̽��پ��⣬��Ⱥ��Э��һ��֡��һ��µ�ksqlDB��뵽ksqlDB��Ⱥ��ʱ�ᴥ��پ��⣬��ߵ�һ��Kafka StreamsӦ�ó��ʵ��崻�Ҳ�ᷢ��پ��⡣�پ��Ӧ�ó��ʱ��ɵģ��ݶ�ʧ��ݴ��ȷ��

stream��ǲ��д��С��Ԫ

ͼ2��ݾ��˼򻯣��Ҫ��һ��Ӧ�ó��ʵ��Ŵ��ʵ��ϣ��д��С��Ԫ��Ӧ�ó��򣬶��stream��һ��Ӧ�ó��һ��stream��⡢��ķ��1��1�ı��Щ��񡣽��Kafka��Ⱥ��Э�飬��һ��Ӧ�ó��ʵ��뿪Ⱥ�飬�ͻᴥ��پ��⣬��Щstream��·��Ӧ�ó��ʵ��

��磬��Ӧ�ó��4��P1��P4��ô�ͻ��4��stream��ֱ��4��4��񱻾��ȵط��Ӧ�ó��ʵ��2��Ӧ�ó��ʵ��ÿ��ʵ��2��

ͼ3. ��1��1�ı��stream��

��1��1��ķ��䷽ʽ˵��е��ǰ��ġ��ڵ�һƪ��У��˵��ͬ��¼��浽ͬһ��֪��¼��浽ͬһ��ж��Ҫ�ˣ��Ϊ��ô��Ǿ�û�а취ͳһ��ǣ��ڴ��û�а취��˳��ǡ�

�ڽ��Kafka��Ⱥ��stream��ĸ��֮��Щ��ͱ��˵��ζ��ʲô��

��Ƿ��ģ��Ҳ��

�򵥵�˵��Ǵ��schema��⣬��Ĵ��֮ǰ��Ĳ�࣬Ψһ�Ķ��ⲽ��Ӧ�ó��Ӧ��schema��תΪ��͡��߽��д��⡣��Ķ��ÿһ��stream��Լ��Ӧ�ó��뿪ʱ��·��Щ��֮ǰ��Ķ�һ��

��Ƿ��ģ��Ҳ��

��Ϊ��ȤһЩ��һ��Ӧ�ó��Ϊ�˴��һ��¼��ס��һ��¼��ĳЩ��Ǿ��״̬��Ӧ�ó��򣬱��ס�Ķ��״̬��

��Ӧ�ó��״̬��һ��ʽ��Ҫ��۶�ľۺϱ��Ҫ��ס��ǰ�¹��״̬��۶Ȼ��ں��ټ��¹��۶�µ��¼��¡��ڷֲ�ʽϵͳ�У�Ҫά��״̬��ٻ��ʩ��ܷ��ϵ��ά��ģ��״̬��һ��޴��ս��Ҳ��Ϊʲô��Cassandra��NoSQL��ݿ��𣬴�ͳ��RDBMS��ݿ��޷��ֽ��ݵ��󡣽��Kafka�еı��ν��״̬��ġ�

��һ��Ҳ�Ƿ��ġ��֮ǰ��۵��ķ��ʽͬ��ڱ��һ��ǣ��Ҫά��¼�֮��״̬��ܽ��оۺϲ��COUNT()��״̬��ͨ��״̬�洢ʵ�ֵģ��ʵ��ļ�ֵ�洢��

ÿ��Լ��״̬�洢��Ա��ÿһ��ѯ��£��Ӧ״̬�洢��һ��״̬�洢λ��Ӧ�ó��ı��ش��̻�ksqlDB��ϡ��״̬��ڱ��صĺô��ǲ��Ҫ�ѱ��״̬�ŵ��ڴ��У��ô��Ҫ��״̬��ʮGB��ࣩ��ڱ��ʵ��Ӧ�ó��ʱ��֡�

Ϊ��֧��ݴ��͵��ԣ�״̬�洢��Զ�̵�Kafka�У��Ժ��ǻὲ��Ҳ��˵��Kafka�Ǳ��ݵ��ʵ��Դ��֮ǰ�ᵽ�ı��ﻯ��ʹ��õ�RocksDB��ΪĬ��棩��ݡ��ȫ�ԡ��˵��ʵ��Եġ��֮��ǿ��һ�㣬��Ϊ�Ҿ��ᱻ�ʵ��RocksDB��ص��⣬��ͺñ�˵��ɡ��ɫ��ȫ��ʵû��ʲô��ϵ��

��״̬�洢Ҳ��ֳ��˶��Kafka�ٷ��ĵ��У��ַ��Ϊ״̬�洢ʵ��һ��10��ô��״̬�洢Ҳ��10��ڴ��У�ÿ��stream��ά��һ��״̬�洢��ǿ��˵stream��״̬�ġ�

��ͼ�У��1��ɫ�ķ��P1��ȡ�¼��Kafka�У��ĸ��޴��ڡ��ֻ��ڷ��ķǹ��ֲ�ʽ��Kafka�Ĵ��߱��˺�ǿ��ԡ�

ͼ4. �ڴ��ʱ��ÿһ��stream��Ҫά��һ��״̬�洢

��ܻ��룬��ô��״̬�洢֮��ʲô��أ��ȣ�ÿ�ű�ͨ��ֻ��һ��״̬�洢��Kafka StreamsӦ�ó��򿪷��߿��Խ��Processor APIֱ�Ӳ��ײ��״̬�洢��Ҫ�õ��ʹ�õ��ksqlDB��ǾͲ��ô��Ϊ״̬�洢ֻ��ڲ��ʵ��ϸ�ڡ��Σ��֮ǰ��˵��ǲ��ֱ��޸ĵģ��RDBMS��ﻯ��ͼһ��״̬�洢Ϊ��ṩ�˶�д��put(key, value)��get(key)��ѯ��롢��»�ɾ��ݡ�

��ô��Ӧ�ó��ksqlDB��е�һ�ű��ռ�ö��ռ䣿��Ǽ��һ��4��ݶ�ȡ��һ�ű��У��ݴ�СΪ12GB��Щ��ݻᱻ�ֵ��4��У�ÿ��Ĵ�С��ݵ��ͬ��ڶ��3GB��5GB��?(event.key, event.value)�Ǿ��ݷֲ��ؼ��ء�

ͼ5. Ӧ�ó��е��ת�ɱ�

ȫ�ֱ��Ƿ��

Kafka��ķ��ƶ��Ժ��˵�𵽷ǳ��ؼ��á��ĳЩ��£��Ҫ��е��¼��ʱ��Ҫ�õ�ȫ�ֱ��һ��ı��һ��ȫ�ֱ��Ƿ��ġ��֮ǰ��Ǹ�ʾ��ÿ��Ҫ��е�12GB��ݡ��Ҫ��㲥��Ϣ��ϣ��ڲ��ݽ��з��½��ӣ��ôȫ�ֱ��ͷǳ��á��Ҫע�⣬Ŀǰֻ��Kafka Streams֧��ȫ�ֱ��ksqlDB��֧�֡�

ͼ6. ��ͨ�ķ��һ��ÿһ��stream��񶼿��Է��ȫ�ֱ��

��ĶԱ�

��ǿ��ٻع�һ�µ�ĿǰΪֹ��Ķ��

�ܽ�

��ƪ��У��ǽ��Kafka�Ĵ��㣬�˽��ͱ��Լ�Kafka Streams��ksqlDB�ķֲ�ʽ��ܹ��һƪ��У��ǽ��ع˱��ĵ��ݣ��˽�Kafka�ĵ��ݴ��

ԭ��ӣ�

https://www.confluent.io/blog/kafka-streams-tables-part-3-event-processing-fundamentals/

��: 2020-02-142020-02-14 09:04:00
��Ϊ InfoQ ��վ�ع��
�׷��ַ��https://www.infoq.cn/article/kZb7AR9AABFMpe3BcjPH
��Ȩ��ϵ cloudcommunity@tencent.com ɾ��

��Ѷ

ɨ��

��վ�� Ⱥ

��ȡר�� 10Ԫ��ż�ȯ

˽�� ��ɻ�

ϵͳ��Kafka��ͱ��

�Ӵ洢��¼��

��Լ��schema

��Ҳ�Ƿ��

stream��ǲ��д��С��Ԫ

��Ƿ��ģ��Ҳ��

��Ƿ��ģ��Ҳ��

ȫ�ֱ��Ƿ��

��ĶԱ�

�ܽ�

��Ѷ

ɨ��

��

�

��Դ

��

��Ѷ�ƿ��

��Ų�Ʒ

��Ƽ�

��Ƽ�

ϵͳ���Kafka�����ͱ���������������

�Ӵ洢���¼�����

������Լ��schema

������Ҳ�Ƿ�����

stream�����ǲ��д�������С��Ԫ

���Ƿ����ģ���������Ҳ��

���Ƿ����ģ���������Ҳ��

ȫ�ֱ����Ƿ�����

������������ĶԱ�

�ܽ�

�����Ѷ

����

�

��Դ

����

��Ѷ�ƿ�����

���Ų�Ʒ

�����Ƽ�

�����Ƽ�

ϵͳ��Kafka��ͱ��

�Ӵ洢��¼��

��Լ��schema

��Ҳ�Ƿ��

stream��ǲ��д��С��Ԫ

��Ƿ��ģ��Ҳ��

��Ƿ��ģ��Ҳ��

ȫ�ֱ��Ƿ��

��ĶԱ�

��Ѷ

��

��

��Ѷ�ƿ��

��Ų�Ʒ

��Ƽ�

��Ƽ�