暂无搜索历史
QR 估算的是目标变量的条件量值,如中位数或第 90 个百分位数,而不是条件均值。通过分别估计不同水平预测变量的条件量值,可以很好地处理异方差。虽然大多数情况下...
现实世界中的应用和规划往往需要概率预测,而不是简单的点估计值。概率预测也称为预测区间或预测不确定性,能够提供决策者对未来的不确定性状况有更好的认知。传统的机器学...
Pandas DataFrame通常用于处理时间序列数据。对于单变量时间序列,可以使用带有时间索引的 Pandas 序列。而对于多变量时间序列,则可以使用带有多...
以往的回归模型实际上是研究被解释变量的条件期望。??们也关?解释变量与被解释变量分布的 中位数,分位数呈何种关系。它最早由Koenker和Bassett(197...
使用 utils.discovery.all_displays 查找可用的 API。
离群点很容易感知,但用数学定义却不容易。相距甚远的数据点就是离群点。一次我在海滩岩石上看日落,一群海鸥站在我旁边的岩石上,有一只灰色的海鸥独自站在另一块岩石上。...
表征学习是机器学习中的一门学科,研究在没有人工干预的情况下发现原始数据表征的系统方法。其目的是利用机器学习算法学习数据中的正常和模糊模式,并用新的特征表示原始数...
支持向量机(SVM)是一种监督学习算法,可处理分类和回归问题,由Vladimir Vapnik及其同事在1992-1995年在AT&T贝尔实验室开发。现已广泛应...
GMM 是由杜达和哈特在 1973 年的论文中提出的无监督学习算法。如今,GMM 已被广泛应用于异常检测、信号处理、语言识别以及音频片段分类等领域。在接下来的章...
Python是一种动态类型编程语言,变量的类型是在运行时分配的,无需在赋值之前定义特定类型。
许多离群点检测方法通常先分析正常数据点,然后找出不符合正常数据模式的观测值。然而,Liu、Ting和Zhou(2008)提出的Isolate Forest(IF...
py12306 项目其实就是一个抢票工具,可能因为临近出行购票热潮,这类项目又重新受到关注。
map 函数接收 1)一个函数和 2)一个可迭代元素。函数的目的是对可迭代的每个元素(想想列表)进行某种转换。然后,它将函数应用到可迭代表中的每个元素,并返回一...
高维数据集是指包含大量变量的数据集,也称为 "维度诅咒",通常给计算带来挑战。尽管大功率计算在某种程度上可以处理高维数据,但在许多应用中,仍有必要降低原始数据的...
无监督 KNN 方法使用欧氏距离计算观测值和其他观测值之间的距离,无需调整参数即可提高性能。其步骤包括计算每个数据点与其他数据点的距离,根据距离从小到大对数据点...
输出标记的对数概率表示在给定上下文的情况下,每个标记出现在序列中的可能性。简单来说,对数概率是 log(p),其中 p 是基于上下文中先前标记的概率。关于 lo...
你是否曾发现自己忙于处理多个文本片段,而忘记了自己复制了什么?有没有想过有一个工具可以记录你一天中复制的所有内容?
ECOD首先以非参数方式估计变量的分布,然后将所有维度的估计尾部概率相乘,得出观测值的异常得分。ECOD假设变量独立,并且可以估算出每个变量的经验累积分布。虽然...
现在,我们将了解一个与经典ARIMA时间序列建模不同的新领域。在监督学习模型中,仅仅使用单变量时间序列似乎信息有限,预测也比较困难。因此,为了生成足够的特征,我...
在本文中,我将介绍一些的最常见的拖垮性能的一些编程代码,并推荐相应的解决方法,为你的 Python 涡轮增压!当然,如果你不限于此,推荐你看下前面推荐 mojo...
暂未填写公司和职称
暂未填写学校和专业
暂未填写个人网址
暂未填写所在城市