��/��/��ţ

��

pandasϵ��ѧϰ��壩��

��Դ�� - coderpai

pandasϵ��ѧϰ��һ��pandas��

pandasϵ��ѧϰ��Series

pandasϵ��ѧϰ��DataFrame

pandasϵ��ѧϰ��ģ��ȡ

pandasϵ��ѧϰ��壩��ӣ��ǰ��£�

�� Python ��κ�ʵ�ʵ��ʱ��Ҫ�� pandas DataFrame �ϲ��һ��ݼ��̻��Ƿǳ��ʱ��ģ��Լ�� 10 ��ӡ��ϲ��merge��ӣ�join��ݿ� ��κ��б��ݷ��ʦ��Ҫ��յĺ��Ĺ��̡��ƪ��½��˺ϲ��ݼ��Ĺ��̣��֮��Ĺ��н��ݼ��һ��Ҫ��Ϊ��Щ��⣺

ʲô��֡�ĺϲ��ӣ�

ʲô��ںϲ��ϲ��ϲ��Һϲ��

��κϲ��в�ͬ��Ƶ��֡��lefton �� righton �﷨��

ʾ��

��ƪ��£��Ҵ� KillBiller Ӧ�ó��һЩ��ĵط��ص��ݣ��Щ��ݰ�� CSV �ļ��У�

user_usage.csv: ��һ��ݼ��û�ÿ��ƶ�ʹ��ͳ��Ϣ��

user_device.csv: �ڶ��ݼ��ϵͳ�ĵ�� ʹ�á� ��ϸ��Ϣ��ں��豸��Ϣ��

android_devices.csv: ��ݼ��豸��ݣ��г��˴�Google��ȡ��Android�豸��ͺŴ��룻

��ǿ��ʹ�� pandas read_csv() ����Щ csv �ļ��Ϊ pandas DataFrame ��ص� pandas�У��ʹ�� DataFrame head() ��ݡ�

�� KillBiller Ӧ�ó��ʾ��ʹ��Ϣ��ʾһ��û��ÿ��ƶ�ʹ��ͳ��Ϣ��

�� KillBiller Ӧ�ó��û��Ϣ��Ϊ KillBiller Ӧ�ó��ĸ�� ;�� ṩ�豸�Ͳ��ϵͳ�汾��

Android �豸��ݣ��о��̺��ͺ��ϸ��Ϣ�� Android �豸��

ע��Ҫ��ݼ�֮��ԣ�userusage �� userdevice ֮�乲�� useid �� userdevice �� device �к��豸��ݼ�� Model �а��롣

�ٸ��

��֪��ͬ�豸֮��û��ʹ��ģʽ�Ƿ�ͬ��磬ʹ��豸��û�ʹ��ͨ��ʱ��Ƿ��ʹ�� LG �豸��û��ࣿ��ǵ��Щ��ݼ��е��С��һ��demo��⣬��Ҫ�ϲ��ʾ��

��ϣ��γ�һ��ݿ��а��û�ʹ��֣�ÿ�º��У�ÿ�¶��ŵȣ��Լ��豸��Ϣ��ģ�ͣ��̵ȣ��С��Ҫ��ǵ��ݼ��кϲ��ӣ��һ��ݼ��н��з��

�ϲ� DataFrame

�ϲ��ݼ��ǽ��ݼ��ϲ�Ϊһ��ݼ��ݹ��Ի��ж��ÿ��ݼ��еĹ��̡�

�ϲ�� pandas ��Կɻ�� SQL �� R �� pandas �У��е�� merge �� join ��߶��Ƶ��顣

��У��Ҫִ��裺

�� userusage ��ݼ��е�ÿһ�С��һ�� userdevice ��֡�е� device ��ѡ��ڵ�һ�У�useid Ϊ 22787��ת�� userdevices ��ݼ��ҵ� use_id 22787�� device ��е�ֵ��

��ɴ˲��ǽ��ȡ��豸�У��豸��ݼ��ҵ��Ӧ�ġ��Ʒ�ơ��͡�ģ�͡��

��ǿ��Բ鿴ʹ�õ��豸��̶�ʹ��в�ֺͷ��ݵĲ�ͬͳ��ݡ�

�ҿ��ʹ�� for ѭ��

�ǵģ��Ϊ��д for ѭ��һ��ѭ�� userusage ��ݼ��е� useid ��Ȼ�� user_devices ��ҵ��ȷ��Ԫ�ء��ڶ�� for ѭ��Ϊ�豸�ظ��˹��̡�

��ǣ�ʹ�� for ѭ��ʹ�� pandas �ϲ��Ҫ��ö࣬Ҳ��߳��ԣ��Ҫʹ�� for ѭ��

�ϲ� userusage �� userdevices

��ǿ��ʹ�� merge �� device �� platform ��ȷ��ӵ� user_usage ��֡��

��ǻ��ڹ��н� user usage �� user devices �ϲ��Ľ��

�ӽ��У��ǿ��ǳ��Ч��Һ��ʵ�֣��ô merge ��һЩʲô�أ�

pandas merge ��ι��٣��ϲ��Ҫ��ݼ��ݼ��͹��Ժϲ��

merge ��ƪ��µ��ҪѧϰĿ�ꡣ��򵥵ĺϲ��֡��һ��֡��ڶ��Ȼ��Ǻϲ��ƣ��ϲ� ��on�� С��У��Ҳ��֡�е��ƥ�䣬�� on�� ָ��ĺϲ��еĹ��ֵ��

��ڿ��Լ�� device ��ݼ��л�ȡ��̺��ͺš��ǣ��Ҫ�˽��йغϲ��ͺ��֡��С��Ϣ��

�ڲ��inner��ࣨleft��Ҳࣨright��ϲ��

��У��ǽ� userusage �� userdevices ��кϲ�� head() �鿴��ַǳ��ǳ��֮�⣬��ǻ��ܻ�ø��Ķ��ȣ��ǿ�� merge ��Ĵ�С��

�ϲ��ݼ� result �Ĵ�С��Ԥ�ڲ��ϣ��Ĵ�С��ݼ��С֮�͡��ΪĬ��£� pandas merge() Ĭ��Ϊ inner �ϲ��ڲ��ϲ��ڲ��ӣ��Ҳ��֡�еĹ��ֵ��ʾ��У�ֻ�а�� userusage �� userdevice ֮��ͨ�õ� use_id ֵ��ӱ�� result ��ݼ��С��ǿ��ͨ��鿴��ֵ��֤��һ�㣺

Ĭ��£�� pandas �н��֮֡��Ĺ��ֵ��ʹ��ڲ��ϲ��

userusage �� 159 �� useid ֵ�� user_device �У��ЩֵҲ��ս��ݿ� 159 ��С�

��ϲ��

pandas ��ֲ�ͣ��͵ĺϲ��Щ�ϲ��ڴ��ݿ��ݵ��ԣ�SQL��R��SAS��ж��ܳ��ͨ��Ϊ join ��Ժϲ��Ǻ��Ϥ��Կ��Ľ��ܣ�

inner merge��Ĭ�ϵ� pandas ��Ϊ��Ҳ��ݿ��д��ںϲ� on ֵ��У�

left merge��ݿ��е�ÿһ�С��Ҳ��ݿ��д�� on ��ȱʧֵ��ô��ڽ�� NaN ֵ��

right merge��ݿ��е�ÿһ�С��ݿ��д�� on ��ȱʧֵ��ô��ڽ�� NaN ֵ��

outer merge��ȫ�ⲿ��ӷ��ݿ��е��У��Ҳ��ݿ��е��У��ڿ��ܶ��ƥ��У��ط�ʹ�� NaN ֵ��

Ҫʹ�õĺϲ��ʹ�� merge ��е� how ��ָ��ģ�ȡֵΪ left��right��inner��Ĭ��ֵ�� outer��Կ��ͼ��

��ϲ��

��ظ��ǵĺϲ�� pandas ��ִ�� ϲ��

��result ��֡�� 159 �У��Ϊ��ǵ��֮֡�乲�� 159 �� use_id ֵ��Ĭ��ʹ�� inner �ϲ��

��ǵ��ϲ�� result ��ǵ��֡ user_usage ��240�У��ͬ�� 159 ��û��ȱʧֵ�ģ�ʣ�� 81 �ж��ȱʧֵ�ģ�

��ϣ�� result ��֡��ͬ��Ϊ userusage �е�ÿ�� useid �� userdevice ��ֻ��һ�Ρ�һ��һ��ӳ�䲢��ˡ��ںϲ��У��ݿ��еĵ��Ҳ��ݿ��еĶ��ƥ�䣬��ɶ�� result �С�� userusage �е� useid ֵ�� userdevice ��֡�г��Σ�� result �н��ڸ� use_id ��

��ʹ�� merge �� how ��ϲ��Ϊ left merge��result ��ݿ�Ķ��ɹ�ƥ����ײ�� userusage �е� userdevice ��û��Ӧ use_id ��С�

�� pandas ��ʾ�� how ��ָ��͡�

��ӵ��

��磬��ǿ��ʹ��Ӻϲ��ظ��˹��̣�ֻ��Ҫ�� pandas merge ��н� how

\=\=left �滻�� how==right��

Ԥ�ڽ��ȷ��ݿ� userdevice ��ͬ��Դ��ݿ��е��ݾͻ��ж��ֵ�� NaN ֵ��userusage �е� outgoingminspermonth��outgoingsmspermonth �� monthlymb ��п�ֵ��Ҳ��ݿ� userdevice �е��û��ȱʧֵ��

�ⲿ�ϲ��

��ǽ�ʹ�� pandas ִ��ⲿ�ϲ��Ҳ��Ϊ ��ȫ�ⲿ��ӡ� �� ⲿ��ӡ��ӿ��Կ��Ӻ��ӵ��ϣ��ӵ��෴��ⲿ��У��Ҳ��ݿ��е�ÿһ�ж��ᱣ��ڽ��У�� NaN Ϊû��ƥ�䵽�ı��

��ˣ��ϣ�� result �� userdevice �� userusage ֮�� use_id �Ĳ�ֵͬ��ͬ��֡��ÿ��ֵ��֡��ÿ��ֵһ�� result �С�

ʹ�� pandas ��ⲿ�ϲ� result ��Ҳ��֡�е�ÿһ�ж�� result �У�ȱ��ֵΪ NaN ֵ��

��ͼ�У��ʾ��ⲿ�ϲ� result �е�ʾ��У�ǰ�� use_id ��֮֡����ʾ��֡��Ҳ��֡��

ʹ�úϲ�ָʾ��ٺϲ�

Ϊ�˰��ʶ��е��Դ��pandas �ṩ��һ��ָ�� merge ��һ��ʹ�ã��ú��д��һ��Ϊ _merge �ĸ��У��ڱ��ÿ�е�ԭʼԴ��

��ͼ�� _merge �ֶ��ǾͿ��Ժ��Ŀ��ÿһ��Դ��ԭʼ��ݵ��ݿ��Ҳ��ݿ�

��պϲ��豸��ϸ��Ϣ��뵽��

�ص��ԭ��⣬��Ѿ�� userusage �� userdevice �ϲ��Ϊÿ��û��ṩ��ƽ̨��豸�� pandas ��ʹ�� inner merge ��ΪĬ��ֵ��ˣ��ֻΪ��豸��Ϣ��û��ṩ��Ŀ��ǽ�ʹ��˺ϲ��Ա��û��Ȼ��ʹ�õڶ��ϲ��ʹ�豸��̴��ͬһ��֡�С�

ʹ�� lefton �� righton �벻ͬ��ϲ�

�ϲ��ʹ�õ��в��Ҫ��Ҳ��֡��ͬ��ĵڶ��ϲ��У��ע��豸 ID ��֡�г�Ϊ�豸��Ҳ��֡�г�Ϊ ģ�͡�

ʹ�� lefton �� righton ��Ϊ pandas �еĺϲ�ָ��˲�ͬ��ǽ�ʹ�� on ��

��豸��ͳ��

��ǵĺϲ��ɣ��ǿ��ʹ�� pandas ��ݾۺϹ��ټ��豸��̵��û��ƽ��ʹ��ע�⣬С��ᴴ��С��飬��Ҳ��Ὣ��Щ�ض��κ�ͳ��塣

��ߣ�chen_h

CoderPai ��һ��רע��˹��Ӧ�õ��㷨ʵսƽ̨����Ҫ��ע�˹��Ӧ����˹��ܸ��Ȥ��ע ��CoderPai�� ΢�źţ�coderpai��ɡ�

��: 2018-10-282018-10-28 18:07:56
ԭ��https://kuaibao.qq.com/s/20181028G14V7900?refer=cp_1026
��Ѷ��Ѷ�ƿ��Ѷ��ݿ��ƽ̨�ʺţ��ţ��֮һ��Ѷ��ݿ��ƽ̨��Э�顷ת�ط��ݡ�
��Ȩ��ϵ cloudcommunity@tencent.com ɾ��

��Ѷ

ɨ��

��վ�� Ⱥ

��ȡר�� 10Ԫ��ż�ȯ

˽�� ��ɻ�

pandasϵ��ѧϰ��壩��

��Ѷ

ɨ��

��

�

��Դ

��

��Ѷ�ƿ��

��Ų�Ʒ

��Ƽ�

��Ƽ�

pandasϵ��ѧϰ���壩����������

�����Ѷ

����

�

��Դ

����

��Ѷ�ƿ�����

���Ų�Ʒ

�����Ƽ�

�����Ƽ�

pandasϵ��ѧϰ��壩��

��Ѷ

��

��

��Ѷ�ƿ��

��Ų�Ʒ

��Ƽ�

��Ƽ�