MySQL标准偏差函数
简介:在本教程中,您将学习如何使用MySQL标准偏差函数来计算填充标准偏差和样本标准偏差。
标准差简介
标准差是衡量数据集中的值分布程度的一种度量。
标准偏差显示与平均值(平均值)有多少差异。
低标准偏差表明数据集中的值接近平均值。
高标准偏差表示数据集的值分布在很大的值范围内。
标准偏差是方差的平方根,可以使用以下步骤来计算:
步骤1.计算数据集中所有值的平均值以获得平均值或平均值,例如,假设数据集包含1、2和3,则平均值为(1 + 2 + 3)/ 3 = 2。
步骤2.计算每个值与平均值的差,并对每个结果求平方,例如(1-2)2 =(-1)2 = 1,(2-2)2 =(0)2 = 0,(3-2)2 =(1)2 = 1。
步骤3.计算步骤2中的平均值,这将产生方差。
然后取方差的平方根来获得数据集中所有值的标准偏差,例如((1 + 0 + 1)/ 3)的平方根= 0.816497
总体标准差与样本标准差
如果将数据集中的所有值都计入计算,则此标准偏差称为总体标准偏差。
但是,如果将值的子集或样本用于计算,则此标准偏差称为样本标准偏差。
西格玛字母(σ)表示标准偏差。
以下等式说明了如何计算总体标准偏差和样本标准偏差:
总体标准差:
样品标准偏差:
总体标准偏差和样本标准偏差的计算略有不同。
在计算样本标准偏差的方差时,除以N-1而不是N,其中N是数据集中的值数。
MySQL标准偏差函数
MySQL使您可以轻松地计算总体标准偏差和样本标准偏差。
要计算总体标准差,请使用以下功能之一:
STD(表达式)–返回表达式的总体标准偏差。
如果没有匹配的行,STD函数将返回NULL。STDDEV(表达式)–等效于STD函数。
提供它仅与Oracle数据库兼容。STDEV_POP(表达式)–等效于STD函数。
要计算样本标准偏差,请使用STDDEV_SAMP(表达式)功能。
MySQL还提供了一些用于总体方差和样本方差计算的功能:
VAR_POP(表达式)–计算表达式的总体标准方差。
VARIANCE(表达式)–等效于VAR_POP函数。
VAR_SAMP(表达式)–计算表达式的样本标准方差。
MySQL标准偏差函数的示例
让我们看一下示例数据库中的订单表。
总体标准差函数示例
首先,以下查询从订单表中返回客户编号及其订单编号:
SELECT customerNumber, COUNT(*) orderCount FROM orders WHERE status = 'Shipped' GROUP BY customerNumber;
其次,以下语句计算客户订单数量的总体标准差:
SELECT FORMAT(STD(orderCount),2) FROM (SELECT customerNumber, count(*) orderCount FROM orders GROUP BY customerNumber) t;
请注意,FORMAT函数用于格式化STD函数的结果。
样本标准偏差函数的示例
假设您只想评估订单表中的已发货订单。
首先,以下查询返回客户编号及其发货订单编号:
SELECT customerNumber, count(*) orderCount FROM orders WHERE status = 'Shipped' GROUP BY customerNumber;
其次,以下查询使用STDDEV_SAMP函数计算样本标准差:
SELECT FORMAT(STDDEV_SAMP(orderCount),2) FROM (SELECT customerNumber, count(*) orderCount FROM orders WHERE status = 'Shipped' GROUP BY customerNumber) t;
在本教程中,我们向您介绍了标准偏差的概念。
然后,我们向您展示了如何使用MySQL标准差函数来计算表达式的总体标准差和样本标准差。