前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >pandas使用技巧-统计元素频数

pandas使用技巧-统计元素频数

作者头像
皮大大
发布2021-03-28 21:42:17
1.2K0
发布2021-03-28 21:42:17
举报

之所以会写这篇文章是因为经常会做词云图,而做词云图一个很重要的因素就是要事先知道每个元素的出现的频数:也就是说通过它们出现次数的多少来决定它们的重要性,所以需要事先将它们的次数统计出来。

模拟数据

代码语言:javascript
复制
import pandas as pd
import numpy as np
from collections import Counter

name_list = ["小明","小红","张三","李四","关宇"]

# 从上面的name_list中随机抽取1000个名字,有放回的抽取,所以结果中会有重复
data = list(np.random.choice(name_list,1000,replace=True))  #  生成列表形式
data[:20]

需求:现在我们的需求就是统计上面的列表中每个名字出现了多少次

通过Python字典获取

代码语言:javascript
复制
dic = {}
for key in data:
    dic[key] = dic.get(key,0) + 1

dic
  • key – 字典中要查找的键。
  • default – 如果指定键的值不存在时,返回该默认值。

利用collections下面的Counter类

代码语言:javascript
复制
from collections import Counter

result = Counter(data)
result

看下官网demo和统计出现最多的两个名字:

利用pandas中的value_counts()方法

这个方法太?了

本文参与?腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2021-3-27,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客?前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与?腾讯云自媒体分享计划? ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 之所以会写这篇文章是因为经常会做词云图,而做词云图一个很重要的因素就是要事先知道每个元素的出现的频数:也就是说通过它们出现次数的多少来决定它们的重要性,所以需要事先将它们的次数统计出来。
  • 模拟数据
  • 通过Python字典获取
  • 利用collections下面的Counter类
  • 利用pandas中的value_counts()方法
相关产品与服务
腾讯云图数据可视化
腾讯云图数据可视化(Tencent Cloud Visualization) 是一站式数据可视化展示平台,旨在帮助用户快速通过可视化图表展示大量数据,低门槛快速打造出专业大屏数据展示。精心预设多种行业模板,极致展示数据魅力。采用拖拽式自由布局,全图形化编辑,快速可视化制作。腾讯云图数据可视化支持多种数据来源配置,支持数据实时同步更新,同时基于 Web 页面渲染,可灵活投屏多种屏幕终端。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
http://www.vxiaotou.com