Python之用K-means聚类进行网站人群分析

文章来源：企鹅号 - 斑点鱼要成为伟大的数据分析师

斑点鱼最近在学《白话大数据与机器学习》，刚学完聚类一章节，整理了下KMEANS算法实例，跟大家分享哈~~

注：三维聚类的图斑点鱼还不会画，有大神看到并且会的话，记得联系斑点鱼，么么哒~~(づ￣ 3￣)づ

附code：

import numpy as np

import pandas as pd

import matplotlib.pyplot as plt

from sklearn.cluster import KMeans

%读取数据

import os

os.chdir('C:\Users\E440\Desktop\PythonStudy')

os.getcwd()

X= pd.read_csv('input/userid2.csv')

X.head()

X=X.dropna()

x2=X.loc[:,['staytime','bounce','page']]

x2=X.loc[:,['staytime','bounce']]

#转换成numpy array

x2=np.array(x2)

#聚成5类

n_clusters=4

cls=KMeans(n_clusters).fit(x2)

cls.labels_#X中每项所属分类的一个列表

X['cluster']=cls.labels_

#画图

markers=['^','x','o','*']#,'+''

for i in range(n_clusters):

members=cls.labels_ == i

plt.scatter(x2[members,0],x2[members,1],s=60,marker=markers[i],c='b',alpha=0.5)

plt.title('')

plt.show()

X.to_csv('output/userid.csv')

一起学习的小伙伴如果有什么想法或者意见，欢迎沟通~

发表于: 2018-03-162018-03-16 09:00:36
原文链接：http://kuaibao.qq.com/s/20180316G0ACH200?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

Python之用K-means聚类进行网站人群分析

相关快讯

扫码

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐