MySQL标准偏差函数

时间:2019-11-20 08:52:16  来源:igfitidea点击:

简介:在本教程中,您将学习如何使用MySQL标准偏差函数来计算填充标准偏差和样本标准偏差。

标准差简介

标准差是衡量数据集中的值分布程度的一种度量。
标准偏差显示与平均值(平均值)有多少差异。

低标准偏差表明数据集中的值接近平均值。
高标准偏差表示数据集的值分布在很大的值范围内。

标准偏差是方差的平方根,可以使用以下步骤来计算:

  • 步骤1.计算数据集中所有值的平均值以获得平均值或平均值,例如,假设数据集包含1、2和3,则平均值为(1 + 2 + 3)/ 3 = 2。

  • 步骤2.计算每个值与平均值的差,并对每个结果求平方,例如(1-2)2 =(-1)2 = 1,(2-2)2 =(0)2 = 0,(3-2)2 =(1)2 = 1。

  • 步骤3.计算步骤2中的平均值,这将产生方差。
    然后取方差的平方根来获得数据集中所有值的标准偏差,例如((1 + 0 + 1)/ 3)的平方根= 0.816497

总体标准差与样本标准差

如果将数据集中的所有值都计入计算,则此标准偏差称为总体标准偏差。
但是,如果将值的子集或样本用于计算,则此标准偏差称为样本标准偏差。

西格玛字母(σ)表示标准偏差。
以下等式说明了如何计算总体标准偏差和样本标准偏差:

总体标准差:

样品标准偏差:

总体标准偏差和样本标准偏差的计算略有不同。
在计算样本标准偏差的方差时,除以N-1而不是N,其中N是数据集中的值数。

MySQL标准偏差函数

MySQL使您可以轻松地计算总体标准偏差和样本标准偏差。

要计算总体标准差,请使用以下功能之一:

  • STD(表达式)–返回表达式的总体标准偏差。
    如果没有匹配的行,STD函数将返回NULL。

  • STDDEV(表达式)–等效于STD函数。
    提供它仅与Oracle数据库兼容。

  • STDEV_POP(表达式)–等效于STD函数。

要计算样本标准偏差,请使用STDDEV_SAMP(表达式)功能。

MySQL还提供了一些用于总体方差和样本方差计算的功能:

  • VAR_POP(表达式)–计算表达式的总体标准方差。

  • VARIANCE(表达式)–等效于VAR_POP函数。

  • VAR_SAMP(表达式)–计算表达式的样本标准方差。

MySQL标准偏差函数的示例

让我们看一下示例数据库中的订单表。

总体标准差函数示例

首先,以下查询从订单表中返回客户编号及其订单编号:

SELECT customerNumber, 
       COUNT(*) orderCount
FROM orders
WHERE status = 'Shipped'
GROUP BY customerNumber;

其次,以下语句计算客户订单数量的总体标准差:

SELECT FORMAT(STD(orderCount),2)
FROM (SELECT customerNumber, count(*) orderCount
FROM orders
GROUP BY customerNumber) t;

请注意,FORMAT函数用于格式化STD函数的结果。

样本标准偏差函数的示例

假设您只想评估订单表中的已发货订单。

首先,以下查询返回客户编号及其发货订单编号:

SELECT customerNumber, count(*) orderCount
FROM orders
WHERE status = 'Shipped'
GROUP BY customerNumber;

其次,以下查询使用STDDEV_SAMP函数计算样本标准差:

SELECT FORMAT(STDDEV_SAMP(orderCount),2)
FROM (SELECT customerNumber, count(*) orderCount
FROM orders
WHERE status = 'Shipped'
GROUP BY customerNumber) t;

在本教程中,我们向您介绍了标准偏差的概念。
然后,我们向您展示了如何使用MySQL标准差函数来计算表达式的总体标准差和样本标准差。