��/��/��ţ

��

Apache DolphinScheduler �� Trino ��ʵ�ֺ��һ��ݽ��

��Դ�� - ApacheDolphinScheduler

https://github.com/apache/dolphinscheduler

�� | �Ӽν�?Apache DolphinScheduler

PMC

Member

��ϲ�ѯ�ͺ��һ�峡��ʱ��Trino �Ѿ��ǲ��ٿ��ߵĲ��֮ѡ��Trino ��һ��ѯ��棬��֡��ϯ��ѯ��ǳ�ǿ��Ȼ��ִ��У��źܶ��û��ע�Ĳ��ǲ�ѯ��Ӧ�ò��Ŀ��ӻ��༭ SQL ��ʧ��ԡ��񲢷��ơ�SQL �汾��ŵ��Щ Trino ��δ�ṩ��˵��ǣ�Apache DolphinScheduler ��Ϊһ��ƽ̨��ó��ľ��ṩ��ϣ��Ϳ��Ի��ȡ��̣��˴˵��

��У��ǽ�ͨ��ʵ�� Apache DolphinScheduler �� Trino ��ϣ��û�ʵ�� OLAP ҵ��ͬʱ��뾡��ٵ��ʵ�ֺ��һ��ݽ��衣

ʲô�� Trino

Trino��һ�ֿ�Դ�ֲ�ʽSQL��ѯ��棬ּ�ڲ�ѯ�ֲ��һ��칹��Դ�ϵĴ��ݼ��(Trino is a query engine that runs at ludicrous speed, Fast distributedSQLquery engine for big data analytics that helps you explore your data universe.) ��Ȼ Trino �� SQL��ʹ�ó��ǳ��Online Transaction Processing (OLTP)��Ҹ��ؽ��ں��һ��д�� Terabytes or Petabytes ��ݡ��Ϊ��ͬʱ֧�ֺ��һ��, ��ݷ�� Ad-hoc ��ܶ๫˾��Ϊ�Ӵ��Դ��ݣ��һ�忪ʼ��ն��û�� ad-hoc ��ȫ��·��ߡ�

Trino ��ǿ��ݴ��̨��ͬʱЭ�� DolphinScheduler һ��Trino ֧�ָ߿��ú� connectors ��ܱ��ն˷��Ŀ��ԣ��нϸߵ�ˮƽ��չ�ԡ�

ʲô�� DolphinScheduler

Apache DolphinScheduler ��Ϊ Apache ��һ�� Top Level Project��һ��ֲ�ʽ�Ϳ��չ�Ŀ�Դ��Э��ƽ̨��ǿ��DAG��ӻ��档��Ҫ��ص��ǣ�ƽ̨��, ��ק, HA, ��, �Լ��ơ�

ƽ̨��Զ��ҵ��߼�� ʧ��ԣ��ƣ��أ��ȣ��û��ʹ��

��ק��ͨ�� UI �� workflow ��Ҫ��λ�� ͬʱ֧�� API �� engineer �� not-engineer ��ܺܺõ�ʹ��

HA��Decentralization��ԭ�� HA ��У��ϼ�Ⱥ��

��ƣ��򵥷��չ��غ��û�ϵͳ��ɣ�ͬʱ�кܶ��ڲ��

�û��

��ǽ�ͨ��һ��ʵ�ʵ��ӣ��ͨ�� Trino �� DolphinScheduler �Ľ�ϣ��û�ʵ�� OLAP ҵ��ͬʱ��뾡��ٵ��

��˾��չ�� C OLTP�׶�

Trino ��Ϊһ��ں��һ�� ad-hoc �Ĳ�ѯ��棬�ǳ��ڿ��ٷ�չ�Ĺ�˾��ֻά��ͬһ�� infra ��ҵ��䳣��ʹ�ó��û��ҵ��ϵͳ�� RDBMS ��洢��û��ҵ��ݣ��û��Ϣ��Ϣ��Ʒ��Ϣ�ȣ��һ�� RDBMS ��̼��Ϣ��Ʒ��ȡ��⣬��ҵ��Ҫ��ⲿ��ȡ��ݣ��֣��GDP��ߣ��Լ��˿��Ϣ�ȡ�

��˾��ڣ��û�רע��ҵ��ϵͳ��ʱ��󲿷ֵĲ��ǻ�� RDBMS �� OLTP �� RDBMS �� CURD��ض��ҵ��

��˾��չ�� C OLAP�׶�

��ҵ��ķ�չ��û�ϣ��ͨ�� BI ��չ��ݣ��ָ��ҵ����ٽ��û��ɵ��۶�Լ�ͨ��ڼ��Ʒ��ݵķ��ó���� ROI (Return On Investment) ��ʱ��û��Ҫһ��ڷ��ϵͳ��ԭ�� RDBMS ��ݿ�ķ�ʽ�Ѿ��֧��Ƶ��ˡ�

�û��ʱ��Ҫ��һ��ͬʱ��㶨ʱ�� BI ��÷��ʦ��Ʒ��ٲ�ѯ�Ĺ��ߡ��ֻ��Ҫά��ͬһ�� infra ��ʩ��ҵ��Trino ��һ��ߣ��ܡ��ȶ��ԡ�� connector ��ԣ��ͬʱ��û��ݵ��󣬱�֤ ad-hoc ��ѯ��ʵЧ�ԡ�

��ʱ��û�� OLAP ϵͳ��ģ�Trino ��Դ��ݿ� RDBMS ��ⲿϵͳ��ݣ�� Trino ��һ�壬ͬʱ��֧��ϵͳ��BI visualization��ڲ��ֳ��̶��ͳ�ƣ� �� Analysis APP��̽��ԡ�ʵ��Բ�ѯ��

��ٵ��

�û��ڹ��һ��ʱ��⡣��ǽ�Χ��Щ��Ĳ��Լ� Apache DolphinScheduler ��ν��Щ��չ��

��ɢSQL��

��ϵͳ��ڼ䣬��Ǻ��һ��Ĺ��Ϊ�˸��õؽ�ʡ��ݼ��ʱ�䣬��SQL�ĸ��Ӷȣ��һ��Ὣ��һ�幹��ӵ�ж�� Layer ��ϵͳ��м��ͼ�� Trino ��в�⣬�ͻᷢ��ɺܶ�SQL��ɣ��SQL֮��в�ͬ��ϵ��ÿ��SQL��Ϊһ��ڵ㣬SQL��Ⱥ�ִ�еĹ�ϵ��Ϊһ��ߣ��SQL��ϵ�͹��һ��޻�ͼ��DAG��ں��һ��ڣ��û��ͨ�� Crontab ��һ��ʱ��ִ�в�ͬ�� SQL��ͨ�� Python �Ƚ�SQL��

��ݵļ�ֵ�޴󣬵��˺��һ�岢�ӷ��еõ��Ľ��󣬾��Ҫ̽��ݣ��ζ�Ÿ��ķֲ㣬�ֲ��ԭ�� Crontab �� Python ��ѹ��ʱ��ҵ��ʵ�λ�ý�SQL�� DAG ��ȱ�дSQL��ʱ�仹Ҫ�ࡣ

��ܻ��ж�� SQL

Apache DolphinScheduler �ṩ�˼򵥸�Ч�� web UI�� û�� DolphinScheduler ��SQL�ű��ʽ��ֱ��SQL��Դ��Ĺ��

SQL��

�� DolphinScheduler �� datasource �д�� Trino ��Դ

�ص� Project ҳ�洴��һ��SQL��񣬲��SQL�ű�ճ��SQL��У��ͨ�� DolphinScheduler ��SQL�ű��DolphinScheduler ��Ϊÿ��ṩSQL�ű��İ汾��û��汾��ˡ�

��Դ��Ĺ��SQL�ļ�

��ʹ��ⲿ��棬�� Amazon S3��MinIO �� HDFS ��SQL�ű��Ȼ��ͨ�� Command line interface �ķ�ʽ�� DolphinScheduler ��Դ��ģ��Լ� Shell ��һ�С�ʹ��Դ��֮ǰ��Ҫ��ò�� DolphinScheduler��Բο��á��Դ��ĺ󣬿��Խ��صĽű�ͨ�� DolphinScheduler ��Դ��ϴ��ӦԶ�˴洢��ʡ�

��ͨ�� DolphinScheduler ��Դ��Ĺ��ǿ�� DolphinScheduler �д��һ�� Shell ��ö�Ӧ��SQL�ű��ͨ�� Trino Command line interface �ķ�ʽִ�ж�Ӧ��SQL��Ҫע��ǣ��ѡ��ʹ��ʽ�ύ��ʱ��DolphinScheduler ÿ�� worker �ڵ㶼��Ҫ��װ Trino Command line interface ��ӵ� $PATH �С�

SQL��

��SQL�ű��Ĺ��⣬��SQL��֮��Ҳ�ǽ�Ҫ��⡣��һ��Ķ��ṹ��ζ��в��SQL��Ҫ��У� �в��SQL��Ҫ��У� ��ô��ִ�е�˳��Լ��֮��Ե÷ǳ��Ҫ��

DolphinScheduler ��Ϊһ��ϵͳ��Ȼ��ܹ��⡣DolphinScheduler ��Ź��ķ�ʽ��ѭ Drag and Drop First ��ԭ��ͨ�� web UI ҳ�� Drag and Drop �ķ�ʽ��ɾ��֮��Ĺ�ϵ��Ҫ��ľ��ͨ��꣬��ǰ��

DolphinScheduler �İ汾��ܹ��и��Ķ��壬 ��ܹ��ζ��汾 revert ��ʱ��ܽ��õ��Ӧ�汾��Ϣ��

��һ�幹��У� ��ͬһ��ֱ�ӵ��⣬��DolphinScheduler ��ṩ�� out-of-box �Ľ��ʽ��磺

��ǰ��ض��ɹ�ʱ��Ҫ��ι��У��ʹ�� DolphinScheduler �е��

��Ҫ��ڵ�ǰ��񴥷��񣬻�ϣ��е��ѡ��ò�ͬ��е��

��ʧ�ܶ��ǳɹ�ʱ��һЩ��񣬿��Ը��״̬��״̬��Բ�ͬ��·�ߡ�

Connector ϵͳѹ��²�ѯ��ʧ��

ʹ�� Trino ��У��û�� connector �򽻵�Ӧ��ġ�Trino ��һ��ƣ� ��һ��SQL�ű��Բ�ͬ connector ��ݽ��в��󽵵��û�ʹ�óɱ��û��Ҫ��ݴ�һ��Ǩ�Ƶ��һ��ط��Ȼ��ѯ��ֱ�Ӷ�ԭ��ݿ��ѯҲ��ܻ��һЩ��⣬��Դ��ݿ��ҵ��ݿ⣬��ҵ��߷��ڵ�ʱ��ݿ��ٶȻ��SQL��ö��ݿ��в��ͻ��ٲ�ѯ��ʧ�ܵ��⡣

��α�֤ Connector ��ѯ��ʧ�ܵ�ʱ��SQL��Ȼ��߼�ʱ�� Alert ��Ϣ��û��Ե��Ϊ��Ҫ��

��Բ�ѯ��⣬DolphinScheduler �ṩ��伴�õ� Timeout ��ƣ��û�Ϊ�� Timeout Threshold��ʱ�䳬��Timeout period ��û��гɹ�ʱ��ᴥ�� Timeout Strategy��Timeout Strategy ��ѡ�� Alert �澯��߷�� Alert �澯��ͬʱ�� Ϊʧ��״̬��û��Ը��õ��ά��һ��е��

��ˣ���ʧ��֮��Ƿ��Ҫ��Ϊ��½DolphinSchedulerϵͳ��أ���û�и��ܵķ�ʽ��ʧ��֮��Զ��أ�� DolphinScheduler ��ʧ��Բ��ԣ��ָ��ʧ�ܺ��ԵĴ��ͼ��У� ��5��Դ��ÿ��Լ��Ϊ 10 ��ӣ��Ч��Դ��ݿ��ѹ��ʱ��Ϊ��봦��Ĵ��ù��и��ʧ�ܵĴ��õ�5�κ��񽫻ᱻ��ʧ�ܣ��Ҳ��С�

��񲢷��

Trino ��֧�ִ��SQL��У��Ȼ��ϣ��workflow orchestration ��˵��֮��Ӱ�쵽 Trino �Ĳ��Ҫ�� workflow orchestration ��߿��֧�ֶ��񲢷��DolphinScheduler ��һ��ĵļܹ�� Ⱥ��ص� Master �� Worker ��֧��ˮƽ��չ��֤��λʱ��и��񣬾�� DolphinScheduler 3.0.2 ��ڵ�̨ 8c16g ��ÿ�� 40 ��

��ڲ��ʱ

�û��ɺ��һ��ı��ź�һ��ҪΪ��ͬ�� workflow ��ò�ͬ�ĵ��ڣ��֤ workflow ��԰��Ҫ��Ƶ��ݣ�DolphinScheduler �� UI �� workflow ��ʱ��ã�ֻ��Ҫ�� workflow definition ��ҵ��Ӧ�Ĺ�� timing�� õ��ȵ� start time�� end time�� crontab ��ʽ��ʱ��á�� workflow ��˶�ʱ��DolphinScheduler ��ڶ�ʱ��ʼʱ�� workflow ��С�

��

�� workflow �ı��Ų��˻��ܺ��ٻص��һ�峡��У��Ϊ��ʷ��ݷ��Բ��Ҫ��ݣ��Ҫ��ʷȫ��ݡ��ʱ�򣬸��Ĵ�� backfill �Ե÷ǳ��Ҫ��ǲ�ϣ��Ϊ��ݺ�ȫ��д��״��룬��ϣ��ͬһ��룬ͨ��ͬ��ʱ��ʷ�� backfill��һ��ṩ�� Complement Data �Ĺ�� data backfill��

��ͼ��ֻ��Ҫ�� trigger ѡ�� Complement Data ��ܣ�ѡ��backfill ��ʱ��Σ��Ѿ� backfill �Ĳ��ԣ�� comfirm �� backfill ��Ĵ��ȫ�� backfill ��ɣ��ʱ��ε��ʷ��Ҳ��ȫ��λ�ˣ��ͼ�е��ɵ�ʱ��Ǿ�� 2019-01-01 �� 2022-01-01 ��ʷ��ݵ� backfill��

��ʵ��

DolphinScheduler �ᱣ��ÿ�� workflow �Լ� task ��״̬�ͼ�¼��û��õز��⣬�� workflow �� task��ζ�ŵ�� Trino ��ʱ��ͨ�� workflow instance �� task instance ��ǰ�� workflow��

��Դ��⣬��Խ��Ӧ workflow ��

��SQL��µ��µ��⣬��ͨ�� DolphinScheduler �ṩ�汾��ɰ汾�Ļ��

Trino + DolphinScheduler

�� Apache DolphinScheduler ֮��ݲֿ��һ��ƴͼ��ˣ�ͬʱ��OLAP��Ȳ��ˣ��ļܹ�ͼ��ͼ��ʾ��ֻ��Ҫ��ܳ�һ��ʱ��û��ϵ OLAP ��ˡ�

��

Trino��https://trino.io/docs/current/overview.html

DolphinScheduler��https://dolphinscheduler.apache.org/#/en-us/docs/3.1.2/about/introduction

�ܽ�

��: 2023-02-212023-02-21 18:00:00
ԭ��https://kuaibao.qq.com/s/20230221A073IP00?refer=cp_1026
��Ѷ��Ѷ�ƿ��Ѷ��ݿ��ƽ̨�ʺţ��ţ��֮һ��Ѷ��ݿ��ƽ̨��Э�顷ת�ط��ݡ�
��Ȩ��ϵ cloudcommunity@tencent.com ɾ��

��Ѷ

��Ԥ�桿DS��Broadcast�� DolphinScheduler��Trino �ܱŷ��ʲô�𻨣�
2024-05-18
��Apache DolphinScheduler��ƽ̨��ʵ��
2024-05-18
Apache DolphinScheduler ��Ѷ��ֵ�Ӧ��ʵ��
2024-05-18
Apache DolphinScheduler ��ʽ��3.0.0 �汾
2024-05-18
Apache DolphinScheduler��淶
2024-05-18
��ݹµ��Apache Doris ��ڼ��ſ��ٹ��һ��ּܹ�
2024-05-18
��ڴ��һ�� DolphinScheduler Workflow
2024-05-18
Apache DolphinScheduler �� 3 ��±�
2024-05-18
�ְ��ֽ��Apache DolphinScheduler��ѧϰ��
2024-05-18
��15�ڡ�Apache DolphinScheduler ÿ�� FAQ ��
2024-05-18
Apache DolphinScheduler �� 3.1.2 �汾��Python API ʵ��Ż�
2024-05-18
DolphinScheduler��ȣ�DolphinScheduler ��Դ��ҵ�񳡾�
2024-05-18
Apache DolphinScheduler �� 2.0.8 �汾��޸��
2024-05-18
DolphinScheduler��ʽ��ҵ��Ϊ Apache ��ᶥ��Ŀ
2024-05-18
3.2.0 �汾Ԥ�棡Apache DolphinScheduler API ��ǿ��ع��
2024-05-18
Ǩ�ƹ�� Air2phin ��Դ��2 ��Ǩ�� Airflow �� Dolphinscheduler
2024-05-18
Apache DolphinScheduler �ڴ��ݻ��е�Ӧ��
2024-05-18
��16�ڡ�Apache DolphinScheduler ÿ�� FAQ ��
2024-05-18
��ھ��ڡ�Apache DolphinScheduler ÿ�� FAQ ��
2024-05-18
Apache Doris��˼�س۵�Ӧ��Ż�ʵ��ͨ��£�ʵʱ��һ��ּܹ��ʵ��
2024-05-18

ɨ��

��վ�� Ⱥ

��ȡר�� 10Ԫ��ż�ȯ

˽�� ��ɻ�

Apache DolphinScheduler �� Trino ��ʵ�ֺ��һ��ݽ��

��Ѷ

ɨ��

��

�

��Դ

��

��Ѷ�ƿ��

��Ų�Ʒ

��Ƽ�

��Ƽ�

Apache DolphinScheduler ���� Trino ����ʵ�ֺ���һ�����ݽ���

�����Ѷ

����

�

��Դ

����

��Ѷ�ƿ�����

���Ų�Ʒ

�����Ƽ�

�����Ƽ�

Apache DolphinScheduler �� Trino ��ʵ�ֺ��һ��ݽ��

��Ѷ

��

��

��Ѷ�ƿ��

��Ų�Ʒ

��Ƽ�

��Ƽ�