��/��/��ţ

��

��ѧϰ��43��Ȼ��Դ��֮word2vec

��Դ�� - ��ݿ�ѧ��ɼ�

��һ��ǽ��Ȼ��Դ��ζԴʻ��б��⣬��Ϊ one-hot �ʻ��Ե�ȱ�ݣ��Ա��ص��˴�Ƕ��ʻ��ʻ��֮��NLP �ĺ��ı��ǽ��ģ�͡�

��ѧϰ�ĽǶȿ��ǽ� NLP ��ģ�Ϳ��һ��ලѧϰ��⣺��Ĵ� X��м�� Y��߸��м�� X��Ĵ� Y�� X �� Y ֮��ӳ��ģ�͡��һ��ģ�͵�Ŀ�ı��Ǽ�� X �� Y ��һ��Ƿ��Ȼ��Է��򣬸�ͨ��һ��˵�� X �� Y ��һ��ǲ��˻��

��ԣ��ڼලѧϰ��˼�룬��ĵ��ǡ��word2vec ��һ�ֻ��ѵ��Ȼ��ģ�͡�word2vec �ǹȸ�� 2013 ��һ�� NLP ��ߣ��ص��ǽ��ʻ��ǾͿ��Զ��ķ��ھ�ʻ�֮��ϵ��word2vec Ҳ��һ��Ĵ�Ƕ��һ�֣�ֻ��Ҫ��ѵ��õ��

word2vecѵ��õ�һ�� X �� Y ֮��ģ�ͣ��ǵĹ�ע�ص㲢��˵Ҫ��ģ��ѵ��ж�ã��Ҫ��ȡѵ��õ��Ȩ�أ��Ȩ�ؾ��Ҫ��ʻ� X ��ʾ��һ��õ��ѵ��дʻ�Ĵ��չ NLP �о��һЩ�ˡ�

word2vec ͨ��汾��ģ�͡�һ��Ǹ��Ĵʣ��Ҫ��Ԥ��м�Ŀ��ʣ��ģ�ͽ��ʴ�ģ�ͣ�Continuous Bag-of-Wods Model��CBOW��һ��Ǹ��һ����Ԥ��ģ��ģ�ͽ�� skip-gram ģ�͡��ÿ��ģ�Ͷ��ֲ��ԣ��Ϊ�˼��ƪ��ͽ��ÿ��ģ�͵�һ��Ҫ��ԡ��߾ͷֱ��ϸ��word2vec ģ�͡�

CBOW ģ��

CBOW ģ�͵�Ӧ�ó��Ҫ��Ԥ��м�ʣ��ǵ��Ĵʣ��Ȼԭʼ�ĵ��޷��Ϊ��ģ��Ȼ��ÿ��ʻ�� one-hot �� Y Ϊ��ʻ��ÿ��ΪĿ��ʵĸ��ʡ��ο� Rong Xin ��и�� CBOW ģ�͵Ľṹͼ��

�ɼ� CBOW ģ�ͽṹ��һ��ͨ��ṹ��Ҫ��㡢�м��ز��㡣��Context(w)��w��Ϊ�� CBOW ģ�͵��м�˵��м��Context(w) �� w ǰ�� c ��ʹ��ɡ�� CBOW �Ĳ��ѧϸ��⣬��ֱ�Ӱ��˲��԰��в��peghoty�Ĳ��ݣ�һ��д��̫�ã��̫�ѣ��漰��̫��ѧ��ʽ��Ĳ��ʽ��

��ͨ�Ļ��ģ��һ�� softmax ��й�һ��㣬��ֱ�� softmax ��Ҫ��ڼ��ٶȡ��ǲ��һ��ϴ�Ĵʻ��ʱ�򣬶Դ�Ĵʻ��㣬softmax �ķ�ĸ��ǳ��ֱ��Ӱ�쵽��ģ��ܡ�

��peghoty��и��ʾ��ǻ�� Huffman �� Hierarchical Softmax ��ּ� softmax��㡣��һ��CBOW ��ѵ��Ȼ�ǻ��ʧ��ݶȼ��㷽��Ŀ�꺯��£�

��˷ּ� softmax ��֮�⣬��һ�ֽ��ѵ�� trick��ﲻ��ϸ��Ȥ��ѿ��в��ϡ�

��ѧϸ�ڿɲο�peghoty�����Ĳ��ݣ�

https://www.cnblogs.com/peghoty/p/3857839.html

skip-gram ģ��

skip-gram ģ�͵�Ӧ�ó��Ҫ��м��Ԥ��Ĵʣ��ǵ�� X ��ⵥ�ʣ�� Y Ϊ��ʻ��ÿ��Ϊ��Ĵʵĸ��ʡ��ο� Rong Xin ��и��skip-gramģ�͵Ľṹͼ��

�ɼ�skip-gramģ�ͽṹ�� CBOW ģ�͵ķ�ת��Ҳ��һ��ͨ��ṹ��ͬ��Ҳ��㡢�м��ز��㡣��Context(w)��w��Ϊ��skip-gramģ�͵��м�˵��м��Context(w) �� w ǰ�� c ��ʹ��ɡ��ͬ�� peghoty ��ͼ��ݣ�

ͬ�� skip-gram ģ�͵�ѵ��Ҳ�ǻ��ʧ��ݶȼ��㣬Ŀ�꺯��£�

�ܽ�

�� CBOW �� skip-gram ģ�͵ĸ��ѧϸ�ڣ�� Huffman ��ʧ��Ƶ��⣬��߲�û�и��ȥϸд��Ȥ��Ѹ��ĩ��Ĳο��Ͻ��ѧϰ��ɡ��Ӽලѧϰ�ĽǶ��˵��word2vec ��һ��Ķ��⣬��ǳ��ʱ��ҪһЩ��ּ� Softmax �͸��֮�� trick ��ѵ��Ȼ��Դ��ĽǶ��˵��word2vec ��ע�Ĳ��ģ�ͱ��ѵ��֮��õ��Ĵʻ��ֱ��ʹ��Ĵ��ά��ҪԶԶС�ڴʻ��С��word2vec �ӱ��˵��һ�ֽ�ά��ǰ��ƵĴʻ�Ӹ�ά�ռ��н�ά��ά�ռ��У��󷽱��˺�� NLP ��

�ο��ϣ�

deeplearningai.com

https://zhuanlan.zhihu.com/p/26306795

word2vec Parameter Learning Explained

Efficient Estimation of Word Representations in Vector Space

https://www.cnblogs.com/peghoty/p/3857839.html

��: 2018-11-082018-11-08 08:08:44
ԭ��https://kuaibao.qq.com/s/20181108B0DMQ400?refer=cp_1026
��Ѷ��Ѷ�ƿ��Ѷ��ݿ��ƽ̨�ʺţ��ţ��֮һ��Ѷ��ݿ��ƽ̨��Э�顷ת�ط��ݡ�
��Ȩ��ϵ cloudcommunity@tencent.com ɾ��

��Ѷ

ɨ��

��վ�� Ⱥ

��ȡר�� 10Ԫ��ż�ȯ

˽�� ��ɻ�

��ѧϰ��43��Ȼ��Դ��֮word2vec

��Ѷ

ɨ��

��

�

��Դ

��

��Ѷ�ƿ��

��Ų�Ʒ

��Ƽ�

��Ƽ�

���ѧϰ��43������Ȼ���Դ���֮word2vec

�����Ѷ

����

�

��Դ

����

��Ѷ�ƿ�����

���Ų�Ʒ

�����Ƽ�

�����Ƽ�

��ѧϰ��43��Ȼ��Դ��֮word2vec

��Ѷ

��

��

��Ѷ�ƿ��

��Ų�Ʒ

��Ƽ�

��Ƽ�