最小显著差异 Least Significant Difference
- 1.举例
- 2.问题
Experimental data has analysed by using Least Significant Difference. The treatment is significant difference if its markup letters is different. 显著差异用不同字母标记
最小显著差异是一种统计学方法,主要用于比较两个或多个处理组之间的均值是否具有显著差异。
图片源自
1.举例
原假设为显著不差异,当p<0.05,表示拒绝原假设,实验显著差异。
假设设定:
- 原假设(H0):假定两组数据之间不存在显著差异。
- 备择假设(H1):假定两组数据之间存在显著差异。
实例1:
假设你正在研究两组植物生长在不同光照条件下的高度差异。你有两组数据集,每组包含了相同数量的植株在两种不同的光照条件下生长的高度数据。
- 数据收集:
- 组A(受光照A条件):[20, 21, 23, 22, 24, 25, 20, 19, 22, 21]
- 组B(受光照B条件):[18, 19, 20, 21, 20, 22, 18, 20, 19, 20]
- 显著性水平的选择:
- 假设你选择了常用的显著性水平 α = 0.05。
- 统计分析:
- 你可以选择使用 t-检验来比较两组的平均高度是否有显著差异。
- 在 t-检验中,如果计算得到的 p 值小于 0.05,那么我们就可以拒绝原假设,认为两组数据之间存在显著差异。
- 假设在你的分析中,计算得到 p 值为 0.02。
- 结果呈现:
- 在论文中,你可以写道:“对于两组植物在不同光照条件下的生长情况,我们进行了 t-检验。结果显示,在显著性水平 α = 0.05 下,两组之间的高度存在显著差异 (p = 0.02)。”
实例2:
假设你是一名医学研究员,你正在研究一种新药对降低血压的效果。你进行了一项实验,随机选择了两组参与者:一组接受了新药治疗,另一组接受了安慰剂(对照组)。
你测量了每组参与者的收缩压(单位:mmHg):
新药组:[120, 125, 130, 135, 128]
安慰剂组:[125, 127, 128, 130, 132]
你想知道新药组的收缩压是否显著低于安慰剂组。
步骤:
-
建立假设:
- 原假设(H0):新药组和安慰剂组的平均收缩压没有显著差异(μ1 = μ2)。(不差异)
- 备择假设(H1):新药组的平均收缩压显著低于安慰剂组的平均收缩压(μ1 < μ2)。
-
选择显著性水平:
- 假设我们选择了显著性水平 α = 0.05。
-
计算t值:
-
使用以下公式计算t值:
t = x ˉ 1 − x ˉ 2 s 1 2 n 1 + s 2 2 n 2 t=\frac{\bar{x}_1-\bar{x}_2}{\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}} t=n1s12+n2s22xˉ1−xˉ2 -
其中,
和
分别是新药组和安慰剂组的样本均值,
和
分别是两组样本的样本方差,n1和n2分别是两组样本的大小。
-
-
计算自由度:
- 在两组样本大小相等的情况下,自由度可以通过以下公式计算:
d f = n 1 + n 2 − 2 df=n_1+n_2-2 df=n1+n2−2
- 在两组样本大小相等的情况下,自由度可以通过以下公式计算:
-
查找临界值:
- 根据设定的显著性水平和自由度,在 t-分布表中找到对应的临界t值。
-
比较计算得到的t值与临界值:
- 如果计算得到的t值落在拒绝域内(超过了临界值),则拒绝原假设,认为新药组的平均收缩压显著低于安慰剂组。
from scipy import stats
# 数据
drug_group = [120, 125, 130, 135, 128]
placebo_group = [125, 127, 128, 130, 132]
# 计算均值和方差
mean_drug = stats.gmean(drug_group)
variance_drug = stats.variation(drug_group)
mean_placebo = stats.gmean(placebo_group)
variance_placebo = stats.variation(placebo_group)
# 计算t值
t_value = (mean_drug - mean_placebo) / ((variance_drug/len(drug_group) + variance_placebo/len(placebo_group))**0.5)
# 计算自由度
df = len(drug_group) + len(placebo_group) - 2
# 查找临界值(单尾,因为备择假设是新药组的平均收缩压显著低于安慰剂组)
critical_value = stats.t.ppf(0.05, df)
# 比较t值和临界值
if t_value < critical_value:
result = "拒绝原假设,新药组的平均收缩压显著低于安慰剂组"
else:
result = "接受原假设,新药组的平均收缩压未显著低于安慰剂组"
print(f"t值: {t_value}")
print(f"临界值: {critical_value}")
print(f"结果: {result}")
2.问题
为什么p>0.05,是差异不显著。而p<=0.05为差异显著
在统计学中,通常设定一个显著性水平(Significance Level)来判断实验结果是否具有统计显著性。显著性水平通常以 α(alpha)来表示,它代表了犯第一类错误(False Positive)的概率。需要注意的是,p值并不是差异的大小,而是关于差异是否显著的统计指标。
- 当 p 值小于或等于显著性水平(p ≤ α)时,我们拒绝原假设,认为实验结果具有统计显著性,即差异显著。
- 当 p 值大于显著性水平(p > α)时,我们无法拒绝原假设,认为实验结果不具有统计显著性,即差异不显著。
这里的显著性水平通常设定为 0.05,但也可以根据实际情况选择其他值,比如 0.01 或 0.10。
原因在于,当 p 值较大时,表示我们观察到的结果在随机情况下也很可能发生,因此不能排除随机性导致的差异。而当 p 值较小时,我们可以更有信心地认为所观察到的差异不是由随机性引起的,而是具有一定的实际意义。
总的来说,显著性水平的选择和结果的解释需要结合具体研究领域和实验设计来进行。
最小显著差异 Least Significant Difference
- 1.举例
- 2.问题
Experimental data has analysed by using Least Significant Difference. The treatment is significant difference if its markup letters is different. 显著差异用不同字母标记
最小显著差异是一种统计学方法,主要用于比较两个或多个处理组之间的均值是否具有显著差异。
图片源自
1.举例
原假设为显著不差异,当p<0.05,表示拒绝原假设,实验显著差异。
假设设定:
- 原假设(H0):假定两组数据之间不存在显著差异。
- 备择假设(H1):假定两组数据之间存在显著差异。
实例1:
假设你正在研究两组植物生长在不同光照条件下的高度差异。你有两组数据集,每组包含了相同数量的植株在两种不同的光照条件下生长的高度数据。
- 数据收集:
- 组A(受光照A条件):[20, 21, 23, 22, 24, 25, 20, 19, 22, 21]
- 组B(受光照B条件):[18, 19, 20, 21, 20, 22, 18, 20, 19, 20]
- 显著性水平的选择:
- 假设你选择了常用的显著性水平 α = 0.05。
- 统计分析:
- 你可以选择使用 t-检验来比较两组的平均高度是否有显著差异。
- 在 t-检验中,如果计算得到的 p 值小于 0.05,那么我们就可以拒绝原假设,认为两组数据之间存在显著差异。
- 假设在你的分析中,计算得到 p 值为 0.02。
- 结果呈现:
- 在论文中,你可以写道:“对于两组植物在不同光照条件下的生长情况,我们进行了 t-检验。结果显示,在显著性水平 α = 0.05 下,两组之间的高度存在显著差异 (p = 0.02)。”
实例2:
假设你是一名医学研究员,你正在研究一种新药对降低血压的效果。你进行了一项实验,随机选择了两组参与者:一组接受了新药治疗,另一组接受了安慰剂(对照组)。
你测量了每组参与者的收缩压(单位:mmHg):
新药组:[120, 125, 130, 135, 128]
安慰剂组:[125, 127, 128, 130, 132]
你想知道新药组的收缩压是否显著低于安慰剂组。
步骤:
-
建立假设:
- 原假设(H0):新药组和安慰剂组的平均收缩压没有显著差异(μ1 = μ2)。(不差异)
- 备择假设(H1):新药组的平均收缩压显著低于安慰剂组的平均收缩压(μ1 < μ2)。
-
选择显著性水平:
- 假设我们选择了显著性水平 α = 0.05。
-
计算t值:
-
使用以下公式计算t值:
t = x ˉ 1 − x ˉ 2 s 1 2 n 1 + s 2 2 n 2 t=\frac{\bar{x}_1-\bar{x}_2}{\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}} t=n1s12+n2s22xˉ1−xˉ2 -
其中,
和
分别是新药组和安慰剂组的样本均值,
和
分别是两组样本的样本方差,n1和n2分别是两组样本的大小。
-
-
计算自由度:
- 在两组样本大小相等的情况下,自由度可以通过以下公式计算:
d f = n 1 + n 2 − 2 df=n_1+n_2-2 df=n1+n2−2
- 在两组样本大小相等的情况下,自由度可以通过以下公式计算:
-
查找临界值:
- 根据设定的显著性水平和自由度,在 t-分布表中找到对应的临界t值。
-
比较计算得到的t值与临界值:
- 如果计算得到的t值落在拒绝域内(超过了临界值),则拒绝原假设,认为新药组的平均收缩压显著低于安慰剂组。
from scipy import stats
# 数据
drug_group = [120, 125, 130, 135, 128]
placebo_group = [125, 127, 128, 130, 132]
# 计算均值和方差
mean_drug = stats.gmean(drug_group)
variance_drug = stats.variation(drug_group)
mean_placebo = stats.gmean(placebo_group)
variance_placebo = stats.variation(placebo_group)
# 计算t值
t_value = (mean_drug - mean_placebo) / ((variance_drug/len(drug_group) + variance_placebo/len(placebo_group))**0.5)
# 计算自由度
df = len(drug_group) + len(placebo_group) - 2
# 查找临界值(单尾,因为备择假设是新药组的平均收缩压显著低于安慰剂组)
critical_value = stats.t.ppf(0.05, df)
# 比较t值和临界值
if t_value < critical_value:
result = "拒绝原假设,新药组的平均收缩压显著低于安慰剂组"
else:
result = "接受原假设,新药组的平均收缩压未显著低于安慰剂组"
print(f"t值: {t_value}")
print(f"临界值: {critical_value}")
print(f"结果: {result}")
2.问题
为什么p>0.05,是差异不显著。而p<=0.05为差异显著
在统计学中,通常设定一个显著性水平(Significance Level)来判断实验结果是否具有统计显著性。显著性水平通常以 α(alpha)来表示,它代表了犯第一类错误(False Positive)的概率。需要注意的是,p值并不是差异的大小,而是关于差异是否显著的统计指标。
- 当 p 值小于或等于显著性水平(p ≤ α)时,我们拒绝原假设,认为实验结果具有统计显著性,即差异显著。
- 当 p 值大于显著性水平(p > α)时,我们无法拒绝原假设,认为实验结果不具有统计显著性,即差异不显著。
这里的显著性水平通常设定为 0.05,但也可以根据实际情况选择其他值,比如 0.01 或 0.10。
原因在于,当 p 值较大时,表示我们观察到的结果在随机情况下也很可能发生,因此不能排除随机性导致的差异。而当 p 值较小时,我们可以更有信心地认为所观察到的差异不是由随机性引起的,而是具有一定的实际意义。
总的来说,显著性水平的选择和结果的解释需要结合具体研究领域和实验设计来进行。