��/��/��ţ

��

��Ӱ��й��ݲ�ҵ��100�ˡ��42�� ڣ��ÿ�Դ��ҵ��Լ��Ĵ��ƽ̨

��Դ�� - CDO��ϯ��ݹ��

ǰ�ԣ�

��һ��¹��ҹ��ᷢչȫ�ֵ�ս��Բ�ҵ��ݼ��Ϊ��ᾭ�û�ṩ��ݣ��߸��Ч�ʣ��ᾭ�õļ�Լ��̶ȣ��ҹ��÷�չת�;��Ҫ��ƶ��ã�2016�꣬��й��ϯ��ݹ��ʱ��𲢳а죬��ѧ��Ϣ��Ϣ��о��ġ��й��һ��IT��ҵ�ƽ��ˡ��Э��ġ�Ӱ��й��ݲ�ҵ��100�ˡ��ר�ûȫ��ɷö��ֱ��ѧ��С��ǽ��Ӳ�ͬ�Ƕȣ��ͬ��Ҳ��ǰ��ݲ�ҵ�ȵ㡢�ѵ㡢�ɵ��⣬Ϊ�й��ݲ�ҵ��չ̽��顢��ݻ��ע��

��ʮ��ר��

�й��ϯ��ݹ��ר��Ա��Ƽ��Ƽ��ϴ�ʼ��

��

�й��ϯ��ݹ��ר��Ա��Ƽ��Ƽ��ϴ�ʼ�ˡ��Virginia Polytechnic Institute and State (��)��ӹ��̲�ʿ��΢��ܲ��ĸ߼��ʦ��΢��Ƽ��ͷ��Ŷӵĺ��ĹǸɳ�Ա��2011��Ӧ��Bing��Ŷӣ��Ʋ��һ��ݼ��ܹ��Լ��ڻ��ѧϰ��⡣�ڷֲ�ʽϵͳ��֤��򷢱��15ƪ��ó��400�Ρ�

��α��й��ϯ��ݹ��˷��³�ĺ��ʹ��ݻ��ܹ��뷽��̽�֡�

³�ĺ����ʱ��̸��ݱ�̸Hadoop��Hadoopһ�ȳ��˴��ݵĴ��ʣ��ȶ��Ȼ��HadoopΪ��ƽ̨�ܹ��ʲô��ħ��

��ڣ���ݴ��Ҫ��ı䣺

1.��ݴ��(Volume)

Ҫѡ��ƽ̨��˽��󣬴��ݵ�ƽ̨�Ӵ�ķ��˵��ΪOLTPƽ̨��OLAPƽ̨��Ϳ��ܵ��û��ѡ��ͬ��ƫ��ƽ̨��OLAP��ƽ̨��˵��˵��С��Ҳ�Ǹ��ƽ̨��һЩ�Ƚϳ��ҵ��ǿ�Դ��postgress��ݿ⣬��Mysql�Ҳ��ԡ��ٴ�һ��MPP��30��ϣ�Hadoop��Ǳ��ѡ��ˡ�

2.��ݶ��(Variety)

��˵��ṹ��ݣ��ݲֿ�ĳ��ǳ�ʵʱ�ģ��ݵĳ��Ƶ�Ļ��ǽ��Ǹ��ר�ŵĳ��

3.��ݿ��ٻ�(Velocity)

��Ҫ��ƽ̨��˵��ǲ��Ƿǳ��Ե��ܹ��ӣ��ǲ��Ƿ��ϵģ��ڼ����ô��ӵ��ܣ��ǲ��Ǿͱ��ˡ�

��֮��⼸��Ƕȳ��Ӳ��ķ�ʽ��ܹ��ּܹ��ʺ��㡣��ͨ��ܹ�Ҳ�ںϲ��һ��˵��HadoopΪ��ôһ��ƽ̨��԰��ȥ��Ե��ݣ��ڸ��ֻ����ϱ��100 ��ֻҪ��ѡ��ϣ��˵��Ƕȳ��һ��һ�ű��ÿ��Ҫ��ʲô��ͷ��Ҫһ��ר�ŵļܹ��Ǿ��Hadoop�ϣ�ͨ��Դ��һ��ϡ��⼸��㣬�Ǵ��ݵ��ԣ�Ҳ��û��ѡ��ƽ̨�ܹ��һ��㡣

³�ĺ����Hadoop��MPP��Ҳ�õ��ܶ�֧�֣��ܸ��Ƿ��һ��ߵĲ�ͬô��

��ڣ��õģ�MPP��˵û��Hadoop��ô�࣬30��ڵ��ϣ��ܾͱȽϵ��ˣ�Hadoop��MPP�ȵĻ��и��ܴ�ĺô��˵��ݺã��һ��Զ��ᶪʧ��ļ�ϵͳ��MPP��ڵ��Ӳ�̻��˵Ļ��Ǹ��ǳ��鷳��飬��Ǹ��ø��Ե�Ӳ�̣�Hadoop��ļ��һ��ļ�ϵͳ��HDFS��ݵ��һ��ԡ��ݴ��ϣ��MPP��ã�Skill��ǿ�󣬼۸�Ҳ��һЩ��

MPP��Hadoop��˵��Ӧ��׸��¡��ֻ�Ƿ��Ļ��ֻҪ��ˡ��Ҫ��ˣ��Ҫ�ǸĵĻ��MPP��ܻ��á�

³�ĺ���ᵽ��ݣ��ܶ��ҵ��빹��ҵ��ʵʱ��ƽ̨��ڼ��ܹ��Щ�õĽ��飿

��ڣ���е��鶼�ǣ��Ҫʲô��ĳ��ʲô��ķ��ʵʱ��ƽ̨��Hadoop, Spark , Storm ,��̬��ô��ִ�ļ��Spark streaming��V��,��һ�µģ�Storm��һ��һ��ʵʱ�Ը��á�LamdaҲ��һ��ܣ��Ҫ��Kafka�Ļ��link in �ģ��SSD��Ż��ȽϺã��ܵ��˵��Ҫ�˽��ǵ��ص㣬�м��ά�ȣ��ر�ʵʱ�أ��ǿ��أ��ȶ��أ��Ƕ��أ��֧�֣�ʵʱ��֮�󣬱�ȻҪ��أ��ô浽ĳ��ط�ȥ��ݿ�ĶԽ��ǲ��Ǻܷ��㣬�ǲ��Ǻ��ף��ҵ��ж��С��⼸��ά�ȶ��С�

�ٸ��ӣ��˵��Ĵ��ܳ��ľ��Storm+kafka+hbase��ֺܳ��ϣ��ʵʱ��Ǹ��Ƶ��Ǹ�1080P��Ƶ��һ��򵥵��ϳ��ز��ô��ڶ�̬ȥ��ʱ��Ҳ��ѡ��ô��ʵʱƽ̨��ѡ��SMACK ��ƽ̨��ҵ��м��ά�ȣ��˵ʵʱ��ƽ̨��һ��͸㶨�ģ��Ǹ��ȭ��

³�ĺ����ƽ̨��·��ѡ��棬�кܶ��˵��Դ�ã�Ҳ�гַ��ģ��ô��

��ڣ��ڽ��죬��еĴ��ƽ̨��ǿ�Դ�ļ��Ծ�ģ��һ��ʼѡ��ҵ·�ߣ��һ��û��У��в��ô��Ŀ��ߡ��ƽ̨һ��ǽ��ڿ�Դ��̬֮�ϵģ��ӹ��ɵġ��磬��ǿ��IBM��Hadoop��SQL�ķ��Ҳ�ǻ��ڿ�Դ�ġ��쿴��Щhadoop�ṩ�̣��Cloudera��MARP��Hortonworks��еļ��ǿ�Դ�ġ��Ҿ��ÿ�Դ��ݱ�ܿ죬��·�ߵķַֺϺ�Ҳ��Ѹ�ͣ��ȡ��ҵ��·��ǲ��ʵģ��Ҿ��ҵ��ǿ��ǿ��Եġ�

³�ĺ����ǰ��˵��ڿ�Դ�Ѿ��ǿ�󣬵��˵��ܺ��ȶ��ԣ��α��ϴ��ƽ̨��ܺ��ȶ��ԣ�

��ڣ���ƽ̨��ȶ��ȡ��ڿ�Դ��ȶ��ԣ��Դ��зǳ����Ȼ��bug,��һ��ã��ţ��ȶ��Ե�Ӱ��Ҳ�ܴ�Ҫ�ǵ��Ų��ȷ��ڴ��ˣ��ͱ��ˣ��ƽ̨�Ľ��裬רҵ��̵ļ�ֵ�Ǻܴ�ģ��һ��Ϳ�ʼ��ˡ��ĳ��ķ��ô��һ��ƽ̨��ô��һ��ʵʱƽ̨��ļܹ��Щ��ϣ��ϣ��ǲ��õ�API��Ѹ�ٿ��Ӧ�ã��㲻�ù��ĵײ㣬��Щ�Ҿ��ö��Ǻܴ�ļ�ֵ��ܹ��ȶ��ܡ�

��Ҷ�֪��д洢��ܣ��ʲôʱ��д洢��Щ�ط��д洢�Ŀ��أ��ܹ��Щ��;��Ǻܿ�ģ��ڿ��Ա��Ӧ�÷��˵��ļ�ֵ��ܴ��ʵ��Ҳ��ֵ�ģ��ǲ��ȥ��޵��еĴ��ʲô��ڿ�Դ�ܹ��ʵ��ܵ��ţ��Զ��ǿ�͵��ʵʱ��ЩAPI��Щ��û��鵽5��ӵ�д��

³�ĺ����Ӧ�ù��У��˻��ƽ̨��ݰ�ȫ��ݼ��ɡ��㷨ģ�Ͷ��ر��ǵĵط��ľ��飬��Щ��ֶα��ݰ�ȫ��

��ڣ���ݰ�ȫ��ֶ��а�ȫ��֤��ͳһ��Ȩ�޹��ݼ��ܣ��ڵĹ��л��ʱ��ģ��л��ڴ洢��ģ��Щ��Ǽ��ֶΣ�˵��ף��ݰ�ȫ��˺��̵��ֶΡ��洢ҽ��ݣ��и�HPIA��֤��֤��ʵҲ�Ǳ�֤��ϵ��ֶ��ܱ�֤��ݰ�ȫ��Ա��¼��ȥ��ʱ��ĵ�¼��Կ��һ�ξ͹��ˣ��ֹ�Ժ��Զ��Ȩ�޵�¼��˺��ϵĹ��ʱ��ȼ��Ҫ��Ҫ��

³�ĺ����ν��Ǩ��뼯�ɣ��Щ�õļ��

��ڣ���ݼ��ɵķ�ʽ��Ϊ��֣��ļ��ļ��أ��ݿ�ĵ��룬��ݵ�ʵʱд�룬��real-time ,��Ǳ�д��ߴ��ݣ��ʵʱ��Ǽ��ͬ�ĵ��Ρ��д�뷽ʽ��˵��ֶ��ṩAPI֧�֣��˵�ļ��룬��һ��ļ��ܼܺ򵥣��Ǽ�ʮ�򣬼�ǧ��ļ��ô��ֱ�Ӹ��ᡱ��ȥ��Ȼ��ݿ�ĵ��룬��ܽ��Щ��ݿ⣬��ͳ��ݿ�Oracle,IBM,΢��ģ��µ�mongodb��ݿ⣬��ingestion��API��Ҫ��û��schema,�ǲ��JSON,��ô��ġ��ʵʱ��ʵʱ��Ŀ��ô��ģ��ܣ��Լ�ʵʱ��߼��жิ�ӣ��Щ��ܶ��Ҫ��ǵģ��Щ��Ǽ��ɵķ�ʽ��

��Ǩ�ƵĻ��ӵ��˵��˵��Ӵ�ͳTERADATA��ݿ�Ǩ��Hadoop��ݲֿ����ô��ı��Ľṹ�ܲ��ֱ��ӳ��ȥ��ǲ��ֱ��֧�֣��Ҫ�ȽϺã��Ǩ�ƹ�ȥ��Ǩ�ƵĹ��У��һ��԰��ݶ�Ǩ�ƹ�ȥ��߽��ݿ��˵��һ��check point ��ǽ��ˣ��һ��֣��ٸ��µ��ֵ��һ��֣��˫�ݿ��һֱͬ��Ĺ��̣��˵һ��Զ�Ǩ�ƹ�ȥ��˵��Ǩ�Ƶ��Ӵ�ĵ��˵��԰��Ǩ�Ƶ�ģʽ��ͬ��ʽ�ģ��ǳ��Ǩ�ƹ�ȥ�ģ��ݽ�ȥ�ķ�ʽ��֣��Ǩ�ƺͼ��Ǽ��ǣ��֣�ѡ��ѡǨ�Ƶ�ģʽ��

³�ĺ����˵�㷨��ģ��ݼ�ֵ��ؼ��һ��ҵ��ȥ��Լ��㷨��ģ�Ϳ⣿

��ڣ��ڽ��죬˵��㷨��Ҫ֪��û��һ��㷨��ͳ��ȫ��磬Google��rankingҲ��ǵ�һ��һ��㷨��Ǻܶ��㷨��ϣ��ҽ��㷨��һ��ѧ��⣬��һ��ѧ��⣬��ѵ��ݵ��ǩ��㷨ѵ��⣬��ʹ��㷨��ٸ��Ч��ѵ��ȫ��ڵ��̣��Ǹ��ܴ�Ĺ��⣬�ǲ��ҵ��Ҫ��ע�ģ��ô��ҵ��ϣ��㷨ֲ��γ��̣�Ȼ��һֱά��㷨�⣬�ܹ��㷨��Ч��ܹ��㷨��Ч��

��棬��Ϊ�û��ṩ��һ��ʽ��װ��㷨��Ϳ��԰��۵��㷨��ҵ�ͻ��۵��㷨��Ϳ�Դ��㷨��һ��ͨ��һ��̴��㷨�ⲻ��һ��⣬һ��㷨��һ��⣬��һ��ߣ�һ��⣬��ԣ��ҵѡһ��㷨�⣬�㷨֧�Ź��ƽ̨��ʱ��Ҫ��ǵģ��ǻ��ں��㷨֮�ϵģ� ��˵feather��ѡ��feather��Ż��ѵ��٣��ǳ��ϸ��ϱߵģ�Ȼ��γɹ��̵��̡��Ǵ�ҿ��㷨��˵һ��㷨�㣬��Կ�Դ��Դ��㣬ֻ�Ǻ�С��һ��㣬��Ҫ��ǣ�ѡ��㷨�Ĺ��ʵ�֣��ĵĵ㡣

��ɡ��ϯ��ݹ��ˡ��ںż��Ӫ��ת�ػ��ø��µ��κ��ݣ��ע��Դ��δ��ͬ�⣬��޸ġ��۸��ݣ��ת�ػ�ʹ�ø��а��κ�ͼƬ��Ӱ��

��: 2018-06-112018-06-11 13:58:25
ԭ��https://kuaibao.qq.com/s/20180611G0W0C000?refer=cp_1026
��Ѷ��Ѷ�ƿ��Ѷ��ݿ��ƽ̨�ʺţ��ţ��֮һ��Ѷ��ݿ��ƽ̨��Э�顷ת�ط��ݡ�
��Ȩ��ϵ cloudcommunity@tencent.com ɾ��

��Ѷ

ɨ��

��վ�� Ⱥ

��ȡר�� 10Ԫ��ż�ȯ

˽�� ��ɻ�

��Ӱ��й��ݲ�ҵ��100�ˡ��42�� ڣ��ÿ�Դ��ҵ��Լ��Ĵ��ƽ̨

��Ѷ

ɨ��

��

�

��Դ

��

��Ѷ�ƿ��

��Ų�Ʒ

��Ƽ�

��Ƽ�

��Ӱ���й������ݲ�ҵ����100�ˡ���42�� ���ڣ��ÿ�Դ����������ҵ����Լ��Ĵ�����ƽ̨

�����Ѷ

����

�

��Դ

����

��Ѷ�ƿ�����

���Ų�Ʒ

�����Ƽ�

�����Ƽ�

��Ӱ��й��ݲ�ҵ��100�ˡ��42�� ڣ��ÿ�Դ��ҵ��Լ��Ĵ��ƽ̨

��Ѷ

��

��

��Ѷ�ƿ��

��Ų�Ʒ

��Ƽ�

��Ƽ�