首页
学习
活动
专区
工具
TVP
发布

信数据得永生

专栏作者
1406
文章
1557938
阅读量
53
订阅数
【译】2024 年的机器遗忘/反学习
随着我们今天的机器学习模型变得越来越庞大,它们的(预)训练集也变得难以理解的庞大,人们 对 对 机器反学习 概念越来越感兴趣,以编辑掉不需要的东西,如私人数据、陈旧知识、受版权保护的材料、有毒/不安全的内容、危险能力和错误信息,而无需从头开始重新训练模型。
ApacheCN_飞龙
2024-05-09
320
【译】下一个大型编程语言是英语(自然语言)
当你输入时,它猜测你想要完成什么,并建议它 认为 你将要编写的代码块。如果它猜对了——而它经常猜对——你只需按下 Tab 键,它会为你填写剩下的部分。在 ChatGPT 到来之前的 2021 年推出的 Copilot,是真正开始蓬勃发展的编程的第一个突破性生成 AI 应用案例。
ApacheCN_飞龙
2024-05-09
140
NumPy 1.26 中文官方指南(五)
ApacheCN_飞龙
2024-04-26
610
NumPy 1.26 中文官方指南(四)
括号中跟着逗号的数字表示一个具有一个元素的元组。尾随逗号将一个元素元组与括号n区分开。
ApacheCN_飞龙
2024-04-26
780
NumPy 1.26 中文官方指南(三)
这些文档阐明了 NumPy 中的概念、设计决策和技术限制。这是了解 NumPy 基本思想和哲学的好地方。
ApacheCN_飞龙
2024-04-26
1710
NumPy 1.26 中文官方指南(二)
NumPy(Numerical Python)是一个开源的 Python 库,几乎在每个科学和工程领域中都被使用。它是 Python 中处理数值数据的通用标准,在科学 Python 和 PyData 生态系统的核心地位不可撼动。NumPy 的用户包括从初学者程序员到经验丰富的从事最前沿的科学和工业研究与开发的研究人员。NumPy API 在 Pandas、SciPy、Matplotlib、scikit-learn、scikit-image 和大多数其他数据科学和科学 Python 软件包中得到广泛应用。
ApacheCN_飞龙
2024-04-26
1070
NumPy 1.26 中文官方指南(一)
NumPy 是 Python 中科学计算的基础包。 这是一个提供多维数组对象、各种派生对象(如掩码数组和矩阵)以及一系列用于数组快速操作的例程的 Python 库,包括数学、逻辑、形状操作、排序、选择、I/O、离散傅里叶变换、基本线性代数、基本统计运算、随机模拟等。
ApacheCN_飞龙
2024-04-26
1580
Pandas 2.2 中文官方教程和指南(五)
对于来自SAS的潜在用户,本页面旨在演示如何在 pandas 中执行不同的 SAS 操作。
ApacheCN_飞龙
2024-04-26
1220
Pandas 2.2 中文官方教程和指南(四)
由于许多潜在的 pandas 用户对 SQL 有一定的了解,本页旨在提供使用 pandas 执行各种 SQL 操作的一些示例。
ApacheCN_飞龙
2024-04-26
1180
Pandas 2.2 中文官方教程和指南(一)
安装 pandas 的最简单方法是作为Anaconda发行版的一部分安装,这是一个用于数据分析和科学计算的跨平台发行版。Conda包管理器是大多数用户推荐的安装方法。
ApacheCN_飞龙
2024-04-26
1060
Pandas 2.2 中文官方教程和指南(十一·二)
写时复制 将成为 pandas 3.0 的新默认值。这意味着链式索引永远不会起作用。因此,SettingWithCopyWarning将不再必要。有关更多上下文,请参见此部分。我们建议打开写时复制以利用改进
ApacheCN_飞龙
2024-04-25
840
Pandas 2.2 中文官方教程和指南(十一·一)
pandas 可以利用PyArrow来扩展功能并改善各种 API 的性能。这包括:
ApacheCN_飞龙
2024-04-25
1140
Pandas 2.2 中文官方教程和指南(十三)
写时复制将成为 pandas 3.0 的默认设置。我们建议现在就启用它以从所有改进中受益。
ApacheCN_飞龙
2024-04-25
2320
Pandas 2.2 中文官方教程和指南(十五)
在 pandas 1.0 之前,object dtype 是唯一的选项。这在很多方面都是不幸的:
ApacheCN_飞龙
2024-04-25
1150
Pandas 2.2 中文官方教程和指南(十四)
pandas 提供了用于操作Series和DataFrame的方法,以改变数据的表示形式,以便进行进一步的数据处理或数据汇总。
ApacheCN_飞龙
2024-04-25
1050
Pandas 2.2 中文官方教程和指南(十七)
Index对象不需要是唯一的;你可以有重复的行或列标签。这一点可能一开始会有点困惑。如果你熟悉 SQL,你会知道行标签类似于表上的主键,你绝不希望在 SQL 表中有重复项。但 pandas 的一个作用是在数据传输到某个下游系统之前清理混乱的真实世界数据。而真实世界的数据中有重复项,即使在应该是唯一的字段中也是如此。
ApacheCN_飞龙
2024-04-25
2030
Pandas 2.2 中文官方教程和指南(十六)
numpy.nan适用于 NumPy 数据类型。使用 NumPy 数据类型的缺点是原始数据类型将被强制转换为np.float64或object。
ApacheCN_飞龙
2024-04-25
1010
Pandas 2.2 中文官方教程和指南(十九·二)
我们使用以下方法传递您的样式函数。这两种方法都接受一个函数(以及一些其他关键字参数),并以某种方式将其应用于 DataFrame,呈现 CSS 样式。
ApacheCN_飞龙
2024-04-25
1150
Pandas 2.2 中文官方教程和指南(十九·一)
本节演示使用 Styler 类可视化表格数据。有关使用图表进行可视化的信息,请参阅图表可视化。本文档是以 Jupyter Notebook 编写的,可在此处查看或下载这里。
ApacheCN_飞龙
2024-04-25
1010
Pandas 2.2 中文官方教程和指南(十二·二)
在使用.loc进行高级索引时,将MultiIndex在语法上整合在一起有点具有挑战性,但我们已经尽力做到了。一般来说,MultiIndex 键采用元组的形式。例如,以下操作会按您的预期工作:
ApacheCN_飞龙
2024-04-25
1970
点击加载更多
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战,赢鹅厂证书、公仔好礼!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
http://www.vxiaotou.com