pandas使用技巧-统计元素频数

皮大大

发布于 2021-03-28 21:42:17

1.2K00

代码可运行

文章被收录于专栏：机器学习/数据可视化机器学习/数据可视化

运行总次数：0

代码可运行

之所以会写这篇文章是因为经常会做词云图，而做词云图一个很重要的因素就是要事先知道每个元素的出现的频数：也就是说通过它们出现次数的多少来决定它们的重要性，所以需要事先将它们的次数统计出来。

模拟数据

import pandas as pd
import numpy as np
from collections import Counter

name_list = ["小明","小红","张三","李四","关宇"]

# 从上面的name_list中随机抽取1000个名字，有放回的抽取，所以结果中会有重复
data = list(np.random.choice(name_list,1000,replace=True))  #  生成列表形式
data[:20]

需求：现在我们的需求就是统计上面的列表中每个名字出现了多少次

通过Python字典获取

dic = {}
for key in data:
    dic[key] = dic.get(key,0) + 1

dic

key – 字典中要查找的键。
default – 如果指定键的值不存在时，返回该默认值。

利用collections下面的Counter类

from collections import Counter

result = Counter(data)
result

看下官网demo和统计出现最多的两个名字：

利用pandas中的value_counts()方法

这个方法太?了

本文参与?晃晃云自媒体同步曝光计划，分享自作者个人站点/博客。

原始发表：2021-3-27，如有侵权请联系 cloudcommunity@tencent.com 删除

晃晃云图数据可视化

本文分享自作者个人站点/博客?前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与?晃晃云自媒体同步曝光计划? ，欢迎热爱写作的你一起参与！

晃晃云图数据可视化

登录后参与评论

0 条评论

热度

pandas使用技巧-统计元素频数

pandas使用技巧-统计元素频数

之所以会写这篇文章是因为经常会做词云图，而做词云图一个很重要的因素就是要事先知道每个元素的出现的频数：也就是说通过它们出现次数的多少来决定它们的重要性，所以需要事先将它们的次数统计出来。

模拟数据

通过Python字典获取

利用collections下面的Counter类

利用pandas中的value_counts()方法

社区

活动

圈层

关于

晃晃云开发者

热门产品

热门推荐

更多推荐