最小顯著差異法：統計學中的多重比較利器

最小顯著差異法 (LSD) 詳解

在科學研究中，當我們對三個或更多組別進行比較時，通常會運用到方差分析（ANOVA）。方差分析能夠告訴我們，所有組別的均值是否存在顯著差異。然而，方差分析的「F檢驗」本身並不能告訴我們具體是哪幾對組別之間存在差異，以及這種差異的顯著程度。這時，就需要進行「多重比較」或「事後檢驗」，而最小顯著差異法（Least Significant Difference, LSD）便是其中一種常用的方法。

什麼是最小顯著差異法 (LSD)？

最小顯著差異法 (LSD) 是一種用於多重比較的統計方法，它的核心思想是，在對ANOVA的整體F檢驗結果表明存在顯著性差異后，對每一對組別進行獨立的t檢驗，從而找出具體哪些組別之間存在顯著差異。LSD 方法的特點在於，它不進行任何校正來控制整體的 I 類錯誤率（Type I error rate，即錯誤地拒絕零假設，認為存在差異但實際上不存在）。換句話說，它以較高的 I 類錯誤率為代價，來維持較高的檢驗效能（Power），即發現真實差異的能力。

LSD 方法的基本原理

LSD 方法的計算基於ANOVA分析中得到的均方誤差（Mean Squared Error, MSE）和樣本量。具體步驟如下：

首先，進行方差分析 (ANOVA)。如果 ANOVA 的 F 檢驗結果顯著 (p < α)，則表明至少有一個組別的均值與其他組別存在差異。
如果 ANOVA 結果顯著，則對所有可能的組別對進行獨立的 t 檢驗。
對於每一對組別的 t 檢驗，計算其 LSD 值。LSD 值是判定兩組均值差異是否達到顯著水平的最小閾值。
計算兩組均值之間的差異。
如果兩組均值之間的絕對差異大於或等於計算出的 LSD 值，則認為這兩組均值之間存在統計學上的顯著差異。

LSD 值的計算公式

LSD 值的計算公式如下：

LSD = t_{(α/2, df)} * √[MSE * (1/n_i + 1/n_j)]

其中：

t_{(α/2, df)} 是在指定的顯著性水平 α (通常為 0.05) 和自由度 df (ANOVA 中的誤差自由度) 下的臨界 t 值。
MSE 是方差分析中的均方誤差（Mean Squared Error），代表了樣本的隨機變異。
n_i 和 n_j 分別是組別 i 和組別 j 的樣本量。

如果所有組別的樣本量都相同 (n)，則公式可以簡化為：

LSD = t_{(α/2, df)} * √[2 * MSE / n]

LSD 方法的優缺點

優點：

高檢驗效能： LSD 方法的檢驗效能較高，尤其是在只有少數組別進行比較時。因為它不進行多重比較的校正，所以更容易檢測出真實的差異。
簡單易懂： 其原理相對簡單，易於理解和計算。
當 ANOVA 結果不顯著時，不進行任何事後檢驗： 這本身也是一種控制錯誤率的策略。

缺點：

I 類錯誤率膨脹： 這是 LSD 方法最主要的缺點。當比較的組別數量增加時，I 類錯誤率會顯著膨脹。例如，如果我們進行 10 對組別的比較，即使所有組別的真實均值都相等，犯下至少一次 I 類錯誤的概率也會大大增加。
不適合探索性研究： 由於其 I 類錯誤率膨脹的特性，LSD 方法通常不適合進行大量的探索性研究，因為它可能導致過多的「假陽性」結果。

何時使用 LSD 方法？

LSD 方法最適合以下情況：

僅進行兩組比較： 如果您只需要比較兩個組別，那麼 LSD 方法與獨立的 t 檢驗效果相同。
ANOVA 整體結果顯著，且預設了明確的比較計劃： 如果 ANOVA 整體結果表明存在差異，並且研究者在研究開始前就已經明確了需要進行哪些特定組別的比較，那麼 LSD 方法可以作為一種選擇。
研究者更關注發現真實差異，且能容忍一定程度的 I 類錯誤率膨脹： 在某些領域，例如藥物研發的早期階段，研究者可能更希望找到所有潛在的有效因素，即使這意味着可能會有一些假陽性結果。

需要強調的是，當需要進行大量的組別比較時，LSD 方法就不再是最佳選擇，這時應該考慮其他更嚴格的多重比較方法，例如 Bonferroni 校正、Tukey-HSD 等。

LSD 與其他多重比較方法的比較

LSD 方法與其他多重比較方法（如 Bonferroni, Tukey-HSD, Scheffé 等）最主要的區別在於對 I 類錯誤率的處理方式。

Bonferroni 校正： 將顯著性水平 α 除以比較的組別對數量，從而嚴格控制整體的 I 類錯誤率。其缺點是會降低檢驗效能，可能漏掉真實的差異。
Tukey-HSD (Honestly Significant Difference)： 同樣控制整體 I 類錯誤率，但在所有組別樣本量相等時，比 Bonferroni 校正更為強大。
Scheffé 方法： 是最保守的多重比較方法，適用於進行任意形式的組間均值比較，能嚴格控制 I 類錯誤率，但檢驗效能最低。

LSD 方法介於這些方法之間，它不進行校正，因此在發現真實差異方面更具優勢，但也伴隨着較高的 I 類錯誤率風險。選擇哪種方法取決於研究的具體目標、比較的組別數量以及研究者對 I 類錯誤和 II 類錯誤（Type II error，即未能發現真實存在的差異）的權衡。

一個簡單的例子

假設我們正在比較三種不同教學方法對學生考試成績的影響。我們有三組學生，每組 10 人。ANOVA 分析顯示教學方法之間存在顯著差異 (p < 0.05)。現在我們需要進行多重比較，找出具體是哪種教學方法效果更好。

假設 ANOVA 分析得到的 MSE = 25，df = 27。如果我們選擇 α = 0.05，那麼 t_{(0.025, 27)} ≈ 2.052。

對於任意兩組比較，LSD = 2.052 * √[25 * (1/10 + 1/10)] = 2.052 * √[25 * 0.2] = 2.052 * √5 ≈ 2.052 * 2.236 ≈ 4.59。

現在，我們計算各組的平均成績：

方法 A：平均成績 80
方法 B：平均成績 88
方法 C：平均成績 75

比較各組均值差異：

|A - B| = |80 - 88| = 8。因為 8 > 4.59，所以方法 A 和方法 B 之間存在顯著差異。
|A - C| = |80 - 75| = 5。因為 5 > 4.59，所以方法 A 和方法 C 之間存在顯著差異。
|B - C| = |88 - 75| = 13。因為 13 > 4.59，所以方法 B 和方法 C 之間存在顯著差異。

在這個例子中，LSD 方法告訴我們，所有三種教學方法之間都存在顯著的差異。但需要牢記，由於我們沒有對多重比較進行校正，如果真實情況是這些方法沒有區別，我們也有可能得到這樣的結果（I 類錯誤）。

常見問題 (FAQ)

Q1: 何時應該使用最小顯著差異法 (LSD)？

A1: LSD 方法最適合在方差分析 (ANOVA) 結果顯示存在顯著性差異，且您只需要對少數幾對組別進行兩兩比較時使用。特別是當您優先考慮發現真實存在的差異（高檢驗效能），並且能夠接受一定程度的 I 類錯誤率膨脹時。然而，如果需要進行大量組別的比較，應謹慎使用 LSD，考慮其他更嚴格的多重比較方法。

Q2: LSD 方法與 Bonferroni 校正的主要區別是什麼？

A2: 主要區別在於它們處理 I 類錯誤率的方式。LSD 方法在進行多重比較時，不對顯著性水平進行校正，因此 I 類錯誤率會隨着比較次數的增加而膨脹，但其檢驗效能較高。而 Bonferroni 校法則通過嚴格地降低單個檢驗的顯著性水平 (α/k，k 為比較次數)，來控制整體的 I 類錯誤率，但其缺點是會降低檢驗效能，可能導致假陰性。

Q3: 為什麼 LSD 方法在比較組數多時，I 類錯誤率會膨脹？

A3: LSD 方法對每一對組別都執行獨立的 t 檢驗，並且以原始設定的顯著性水平 α (例如 0.05) 來判斷。當進行的多重比較次數增多時，即使所有零假設（即各組均值無差異）都是真實的，至少有一個檢驗偶然達到統計學顯著的概率也會隨之增加。這就像拋硬幣，你拋的次數越多，偶然出現連續多次正面的概率也就越大。

Q4: LSD 方法是否總是比其他多重比較方法更強大？

A4: LSD 方法在發現真實存在的差異（即檢驗效能）方面，尤其是在比較組數不多時，通常比經過校正的多重比較方法（如 Bonferroni, Tukey-HSD）更強大。這是因為它沒有對顯著性水平進行「削弱」。然而，這種「強大」是以更高的 I 類錯誤率風險為代價的。因此，說它「總是」更強大並不准確，應該說它在特定條件下（較少比較，優先發現差異）可能更具優勢，但在控制整體錯誤方面則不如其他方法。