��/��/��ţ

��

Go��C++ͨ��Ż��ħ��PGO��

��Դ�� - �Ƽ��

��

��ڽ��Ż��ʱ��Ӧ�ø��ֻ�ʽ��Ż��ֶΣ��Ż��㷨��Ӷȣ�� O(N) �Ż�� O(logN) ��Ż��Ȼ��Ӧ�ø��ֳػ��ڴ�ء��ӳء��̳߳ء�Э�̳صȡ�ѹ��Ԥ��ȡ��桢��SIMD��ڴ��ȵ��ֶκ��ʵ��һ��ֶξ�� Profile-Guided Optimization ��PGO��Ļ�� PGO ��ԭ��Լ� Go/C++ ��Խ�� PGO ��ʵ��

Ŀ¼

1 Profile-Guided Optimization (PGO)ԭ��

2 Go �� PGO?ʵ��

3 C++�� PGO ʱ��

4 ��ʵ��͹滮

ͨ��£��ϵͳ��Ż��һ��з��ѧ��ʮ�˰��ȫ��ϵĳ־��Ŀ��ϰ��ٶȡ��ɱ�ֻ��ѡ��ϰ��Զ��ȫ��Ҫ����Ż��ַ�ʽ�Ժ��ϰ��ʣ��ܻ��ܲ��ٿ�һ��ʱ��ô�죿�𼱣�PGO?��԰��㡣

Profile-guided optimization (PGO)�ֳ� feedback-directed optimization (FDO)?��ָ��ó��й��вɼ�� profile ��ݣ��±��Դﵽ�Ż�Ч�� post-link �Ż��һ��ͨ�ü��ĳ��ԡ�

Profile-Guided Optimization (PGO)ԭ��

PGO ��Ҫ�Գ��ʷ�(Profile)��ռ��ʵ��е�� profiling �ļ��ݴ��ļ��Ż��ͨ��С��С��ٴ��֧Ԥ�⣬��֯��벼�ּ��ָ���ȷ��PGO ��ṩ�ִ�д��򣬱��֪��Щ��Զ��Щ��Ժ;��Ż��

PGO ��嶼��3��裬��ϸ�ڿ��΢�е��죬��ὲ��

��1��

��ʱ��ӱ��ѡ��Ա��ڲ��е�ʱ�� prof �ļ�� clang ��-fprofile-instr-generate��-fdebug-info-for-profiling��-funique-internal-linkage-names ѡ��ȡ�

��2��

�ò��Ǹ��ݲ��1��ɵĿ�ִ�г�� prof �ļ��ͨ��ַ��һ�ַ�� clang ��-fprofile-instr-generate ѡ��ò��൱��ڱ��ʱ��׮��ʱ�Զ�� prof �ļ��һ�ֳ�֮Ϊ AutoFDO��ʱ��̬�ɼ��C++�ȿ�� perf��Go �Ļ��?runtime/pprof?or?net/http/pprof ?��Բɼ��

��3��

��3�Ǹ��ݲ��2�� prof ��±��룬ͬʱ�б�Ҫ�Ļ�ȥ��1��ӵı��±��µĿ�ִ��ļ��

1.1?��֧Ԥ��Ż�

��ü򵥵�һ�� if �ж��˵��Ϊʲô��ٴ��֧Ԥ��ʵ��Ż��ʾ��룺

if condition { // ִ��߼�1} else { // ִ��߼�2}

�ڱ��ʱ��ڱ��ܼ�� condition Ϊ true �� false �ĸ��ʣ��԰��ն��˳�� condition Ϊ true ִ��߼�1��Ծ�� else ִ��߼�2�� CPU ��ʵ��ִ��У��ָ��˳��ִ��Լ� pipeline Ԥִ�еȻ��ƣ��ˣ��ִ�е�ǰָ��ŵ��һ��ָ���ָ�� condition Ϊ true ��ô��ˮ�߱�һ��ǳɣ�û��ת�Ŀ��෴�ģ�� condition Ϊ false��ô pipeline ��ǰԤִ�е��߼�1 ��ᱻ��ϣ�ת��Ҫ�� else ��¼��ָ���ִ��߼�2��Щ��Ļ��ָ��ִ��ܡ�

��ʵ��У�condition Ϊ true �ĸ��ʱȽϴ��ô�ô��Ƭ�λ�Ƚϸ�Ч��֮��Ч��Գ��ڵ� pprof ?profile ��ݽ��вɼ��Եõ��ķ�֧�ж��У�ʵ�� if ��֧�� else ��֧�Ĵ��ͳ��ݣ�� PGO ��У�� else ��֧�ĸ��ʽϴ��Խ��Ч��Խ��ԣ��Զ��Ļ��ָ��е��ʹ��ɵ�ָ��Ӷ�� ִ��߼�2��ʵ�ܼ򵥱��ָ�� je ��ھ��ת�� ȼ��滻�� jne��ھ��ת��

Go �� PGO ʵ��

Go ��Դ� Go1.20 ��ʼ��֧�� PGO �Ż��Ĭ��ǹرյ� -pgo=off�� Go1.21 ��ʼ -pgo=auto Ĭ�ϴ򿪡��Ҳ��Եļ�� case �� Go.1.20 ��Ż�Ч��ԣ�Go1.21 ��Ż�Ч��ԣ�� Go1.21 �Ѿ�� Go1.21 ��ϰ汾��

2.1?Profile �ļ��ɼ�

Go �� PGO ��Ҫһ�� cpu pprof profile �ļ��Ϊһ��룬��ϲ�� Go profile �ļ��Ѿ��ɵ��ʱ��?runtime/pprof?and?net/http/pprof)��ֱ�Ӳɼ��ȡ��Ȼ��ĸ�ʽ��ļ�� Linux perf ��һ��ǰ��Կ��ת�� pprof format Ϊ Go PGO ��á��򵥵ķ��ǣ�curl -o cpu.pprof "http://localhost:8080/debug/pprof/profile?seconds=30" �ӷ��ʵ��ȡ 30s ��ݡ��ԭ�� 30s ��ݿ��ܲ��д��ԣ�

��ʵ��ִ�з��ʱ��ȽϿ��У��ƽʱ��ܱȽ�æ��

��ʵ��ĳ�췢��˱仯��ʵ��ΪҲ��˱仯��

�ڲ�ͬ��ʱ��ִ�в�ͬ�Ĳ��ͣ��ܸ� 30s �Ĳ��ֻ�ܸ��ǵ�һ�Ĳ��͡�

��ʵ��쳣��

��

�Ƚ��Ƚ��ǲ�ͬʱ��ռ��ͬʵ�� profile �ļ��Ȼ��ϲ��һ��ļ�� PGO ʹ�ã��Ƶ�� profile �ļ��Ӱ�졣

go tool pprof -proto a.pprof b.pprof > merged.pprof

��Ҫע��ǣ�profile �ļ��ռ��Ҫ��ɻ��ʵ��ʵ��Ż�Ч��á��Ԫ��Ի��߲��ֵĻ�׼��Բ��ʺ� PGO �Ż��Ϊ��֧�ֳ��һС��Ч��΢��

2.2?PGO �ĵ��

��˵�� Go 1.21 ��ϰ汾��׼�Ĺ��ǽ� default.pgo �ļ�� main package ��ڵ�Ŀ¼��Go ��̽�⵽ default.pgo �Զ�� PGO �Ż��ַ�ʽ�⣬Ҳ��ָ�� profile �ļ�·��

go build -pgo=/pprof/main.pprof

��ڳ��һֱ�ڿ��Բ��2�Ͳ��3��һ��ѭ��̡��2�е� profile �ļ��Ӧ��Դ��µ�Դ��ǲ�һ��ģ�Go PGO ��ʵ�ֶԴ˾��³��ԣ��֮ΪԴ�ȶ��ԡ�ͬ��ھ��һ�ε��󣬶��Ƶİ汾Ҳ��ʹ��ϴ� profile �ļ��Ѿ��Ż��İ汾��Go PGO ��ʵ��ͬ��Դ˾��³��ԣ��Ϊ��³��ԡ�

2.2.1?PGO?Դ³��

Դ�ȶ��ͨ��ʹ��ʽ��ļ��е�ʾ��Դ��ƥ��ʵ�ֵġ��ˣ��Դ��ģ��¹��ܣ��ƥ��д��û��Ӱ�졣��޷�ƥ��ĵĴ��ʱ��һЩ�Ż��ᶪʧ��ע�⣬��һ��ŵĽ��δ��ƥ��ܻ�ʧȥ�Ż��ᣬ�� PGO ��ͨ��ֲ��ڶ��С�

Go �� PGO ��Ŭ��ļ��е��뵱ǰԴ��ƥ�䡣��˵��Go �ں��ʹ��ƫ�ƣ��磺��ú��ĵ�10�У��ܵ��˵��һ��ƻ�ƥ�䣬��һ��û��ƻ�ƥ�䡣

��ೣ��޸Ĳ��ƻ�ƥ�䣺

��Ⱥ��֮��ļ��ں��Ϸ��·��/��Ĵ��룩��

��ƶ��ͬһ��е��һ��ļ��ȫ��Դ�ļ��

��һЩ�޸Ļ��ƻ�ƥ�䣺

�Ⱥ��ڵĸ��ģ��ܻ�Ӱ��ƫ�ƣ��

��/�򷽷��ͣ��ķ��ƣ��

��ƶ��һ��ķ��ƣ��

�� profile ��Խ��£��ֻ��Ӱ��ź��Ӷ��޷�ƥ��ĺ��д��Ż��Ӱ�졣��ˣ��ʱ��ƣ�profile ��ɣ��½��ۻ��Ϊ��ٱ��ع��ؾɵ��ʽ��˶��ռ��µ� profile ��е�Դƫ��ǳ��Ҫ��

profile �ļ�ƥ��ȿ��͵�һ��Ǵ��ģ�ع��ຯ��ڰ�֮��ƶ��ǡ��£��ܻ��ܵ��Ӱ�죬ֱ��µ� profile �ļ��Ч��

2.2.2?��³��

��ȶ��Ϊ�˷�ֹ��? PGO ?��еĿɱ��ѭ��磬�� 1 �죬�� 2 �� 3 �죬�ȵȣ��ʹ�� CPU profile�ļ��ʶ��Ҫ�Ż��ź��á��ϣ�PGO ?��Դ��ӿ��Ⱥ��ٶȣ�ʹ��һ�� profile �в��ʾΪ�Ⱥ��Ҳ��õ��Ż��Ӷ�ʹ��ٴα��Go �� PGO �Ż��ȡ��صķ��Ϊ��Է�ֹ��ش��졣

2.2.3?�ܽ�

�� Go PGO ��ܱ�֤Դ�ȶ��Ժ͵��ȶ��ԣ��Ǿ��Ҫ��׶ι��ķ�ʽ��ǵķ��񡣵�һ�׶ι��һ��δ�� PGO �Ż��İ汾��Ҷȷ��Ȼ��ɼ��Ӧ�� profile �ļ��ڶ��׶θ��ݲɼ�� profile �ļ�� PGO �Ż��ٴ�ȫ��ɻ��

2.3 ʵ��

��ǵĸ�� sidecar �� Go 1.21 �� PGO �Ż��󣬴��5%��Go �ٷ��ݴ��2��7%��ҵ��Ҳ��ֿ�ʼӦ�� PGO ��Ż��Go δ�� PGO ��Ż��ǿ��Գ��ע�¡�

2.4?Go PGO δ��

�� Go �� member @aclements ?�� PGO ��һ�� issue ��ᵽ�� PGO ��Ż��ķ��ȫ�б��

��Ѿ��ܳ��ˣ��

��򣬶Ժ��򣬾۽��ȿ�Ľ��֧Ԥ�⡣

�Ĵ��䣬Ŀǰ�Ĵ��ʽȷ��·��Ƴ��PGO ��Ը�֪��·��

��Ƶļ��Ժ��;ۼ��Ժ��õľֲ��ԡ�

ȫ�ֿ��򣬳�Խ��һ��伯��ʽ��ȷ��룬Ҳ�п��ܱ��

��ӵ��ȥ��⻯�� C++ ��ƣ�� C++ ��ϸ����

ģ�滯�� profile ��ģ�滯��ͨ�ú��

map/slice ��Ԥ��䡣

��ڷ��䣬��ڵķ��һ��

C++ �� PGO ʵ��

�� profile ��Ż��Ĵ��ķ��䣬�Ż�ѭ��ʸ��ֻ��ѭ�� vectorize��vecrorize ��Ӷ��гɱ��֧Ԥ��׼ȷ�Եȡ�C++ ��麯�� Speculative devirtualization �Ż��ڷ�֧Ԥ��׼ȷ�ԣ��ص㽲�¡�

3.1?�麯��Ż�

C++��麯��ʹ��ǳ��㣬��ĳ��Ҳ�ǳ��ã��һ��Ŀ��ͨ��ʹ��麯��Ҫ��ǳ��ߵĳ��ܻ��һ��Ӱ�죬��Ҫ��µķ��棺

�ռ俪����ҪΪÿһ��麯��һ��麯��Գ��Ķ��ļ��С��Ӧ��Σ��ڰ��麯��ʵ��˵��ÿ��ʵ��һ��麯��ָ��ָ��Ӧ��麯��ÿ��ʵ��Ŀռ�ռ�ö��һ��ָ��С��32λϵͳ4�ֽڣ�64λϵͳ8�ֽڣ��Щ�ռ俪��ܻ��ɻ��Ĳ��Ѻã��һ��̶��Ӱ��ܡ�

�麯��ң��麯��һ��ڴ�Ѱַ��ͨ��麯��ָ��ҵ��麯��һ��㿪��ǻ��á�

��ӵ��ã�indirect call����ڵ�ʵ�ʺ��ӿڣ��ַ�Ƕ�̬��ֵ�ģ��ָ��޷��Ż��ֻ��ֱ��ִ�� call ָ���ӵ��ã��ֱ�ӵ��ö��ԣ��ǲ��ڷ�֧��ת�ģ��Ϊ��ת��ַ�Ǳ��ȷ��ģ�CPU ֱ��ȥ��ת��ַȡ��ָ��ɣ��ڷ�֧Ԥ�⣬��Ա�֤ CPU ��ˮ�߲��ϡ��ڼ��Ѱַ��ת��ַ��ȷ��Դ˴��ж��֧��ܣ��ʱ��Ҫ��֧Ԥ��Ԥ�⣬��֧Ԥ��ʧ�ܣ��ᵼ��ˮ�߳�ˢ��½��ȡָ��Ȳ��Գ��кܴ��Ӱ�졣

�޷��Ż���� virtual ��ʵ�ֱ��Ƕ�̬�ģ��޷��ó�ʵ��ڻ�ִ�е�ʵ�֣��Ҳ�޷��Ż��ͬʱ�ںܶೡ��£��һ��ֻ��Ϊ�˵õ��ַ��ֵ��ã��ʵ��ͨ��ִ��ĳЩ��㣬��Щ��㱾��ͨ��Ż��޷��indirect call ��ִ�и��Ч�ļ��㡣

�谭��һ��ı��Ż��indirect call �൱��ָ��е�һ��ϣ��䱾��һ��ڲ��ȷ��ĵ��ã��ڱ��ڻ�ʹ��ֿ��ж��Լ��չ��ʧЧ��Ӷ��ƽ�һ��뼰��ӵ��Ż��ռ䡣

3.2?Basic devirtualization

��ͨ��һ��˵��ȥ��⻯�ģ�

class A {public: virtual int foo() { return ; }};

class B : public A {public: int foo() { return 2; }};

int test(B* b) { return b->foo() + ; }

�� test(B *b) �� b->foo() ��ʱ��֪�� b ��һ�� B ��ͣ�� B ��ͣ��Ա��ɵĴ��ӵ��ã�indirect call �У�19��麯��(b->foo())��gcc 9 ��ɵĻ��£��ü��󣩣�

12 subq $16, %rsp 13 movq %rdi, -8(%rbp) 14 movq -8(%rbp), %rax 15 movq (%rax), %rax 16 movq (%rax), %rdx 17 movq -8(%rbp), %rax 18 movq %rax, %rdi 19 call *%rdx 20 addl $3, %eax

��ǰ�� class B �Ĵ��һ�£��ӹؼ�� final ��

class B : public A {public: int value() final { return 2; }};

��֪�� class B ��࣬��Խ��ȥ��⻯�Ż�(-fdevirtualize )��£�

6 _ZN1B3fooEv: 7 .LFB1: 8 .cfi_startproc 9 pushq %rbp 10 .cfi_def_cfa_offset 16 11 .cfi_offset 6, -16 12 movq %rsp, %rbp 13 .cfi_def_cfa_register 6 14 movq %rdi, -8(%rbp) 15 movl $2, %eax 16 popq %rbp 17 .cfi_def_cfa 7, 8 18 ret 19 .cfi_endproc 20 .LFE1: 21 .size _ZN1B3fooEv, .-_ZN1B3fooEv 22 .text 23 .globl _Z4testP1B 24 .type _Z4testP1B, @function 25 _Z4testP1B: 26 .LFB2: 27 .cfi_startproc 28 pushq %rbp 29 .cfi_def_cfa_offset 16 30 .cfi_offset 6, -16 31 movq %rsp, %rbp 32 .cfi_def_cfa_register 6 33 subq $16, %rsp 34 movq %rdi, -8(%rbp) 35 movq -8(%rbp), %rax 36 movq %rax, %rdi 37 call _ZN1B3fooEv 38 addl $3, %eax 39 leave 40 .cfi_def_cfa 7, 8 41 ret 42 .cfi_endproc

��Կ��ӵ��Ѿ��޸ĳ�ֱ�ӵ��ã��Ȼ��Խ�һ��Ż��һ��ָ�

6 .LFB2: 7 .cfi_startproc 8 movl $5, %eax 9 ret 10 .cfi_endproc

3.3?Basic devirtualization

��ʵ��ȥ�Ƶ�ȥ��⻯��Ǿ�һ��򵥵��˵��£�A* ptr->foo()��ptr ��һ��ָ�룬�� A Ҳ�� B��ǵ��࣬��ڱ��޷�ȷ��͡��ʵ�ʵ��еģ�ptr �� A ��󣬶��B��speculative devirtualization��gcc �ı��-fdevirtualize-speculatively�� Ż��ͻ᳢�Խ��µ�ת��

if (ptr->foo == A::foo) A::foo ();else ptr->foo ();

��ת��󣬽��ӵ��ת��ֱ�ӵ��ã��Ϳ��Խ��ֱ�ӵ��Ż��˵ inline �ȡ�

3.4?ʵ��

��ڽ�� envoy ��Ż��ԣ��¡�

Ӳ��ʩΪ V8 ��ĸ��Ϊ M6 �Ļ��£�

model name: Intel(R) Xeon(R) Platinum 8255C CPU @ 2.50GHz

cpu MHz: 2494.140

cache size: 36608 KB

envoy �汾Ϊ V1.26.0��δ��۶Ϻ��ã�� tracing ��Ϊ��֮һ�� playload 1k��rpc Э��Ϊ srf Э�顣

��Ϊ clang14��£�

��Կ��ڿ�� PGO �Ż��£�ƽ��ʱ�Ӽ��14%��18%��QPS ��15%��18%��ҡ�

��: 2023-10-192023-10-19 18:32:40
ԭ��https://page.om.qq.com/page/Ok8ekOAO3NVynLMdmKyCzuCQ0
��Ѷ��Ѷ�ƿ��Ѷ��ݿ��ƽ̨�ʺţ��ţ��֮һ��Ѷ��ݿ��ƽ̨��Э�顷ת�ط��ݡ�
��Ȩ��ϵ cloudcommunity@tencent.com ɾ��

��Ѷ

ɨ��

��վ�� Ⱥ

��ȡר�� 10Ԫ��ż�ȯ

˽�� ��ɻ�

Go��C++ͨ��Ż��ħ��PGO��

��Ѷ

ɨ��

��

�

��Դ

��

��Ѷ�ƿ��

��Ų�Ʒ

��Ƽ�

��Ƽ�

Go��C++ͨ�������Ż���ħ������PGO��

�����Ѷ

����

�

��Դ

����

��Ѷ�ƿ�����

���Ų�Ʒ

�����Ƽ�

�����Ƽ�

Go��C++ͨ��Ż��ħ��PGO��

��Ѷ

��

��

��Ѷ�ƿ��

��Ų�Ʒ

��Ƽ�

��Ƽ�