【協方差計算公式】在統計學中,協方差是一個用來衡量兩個變量之間線性關系的指標。它可以幫助我們了解一個變量如何隨著另一個變量的變化而變化。協方差的值可以是正數、負數或零,分別表示兩個變量呈正相關、負相關或沒有線性關系。
為了更好地理解協方差的計算過程和實際應用,以下將對協方差的基本概念、計算公式以及實際案例進行總結,并通過表格形式展示關鍵信息。
一、協方差的基本概念
協方差(Covariance)用于描述兩個隨機變量之間的總體變化方向。如果兩個變量同時增加或減少,則它們的協方差為正值;如果一個變量增加而另一個變量減少,則協方差為負值;如果兩者之間沒有明顯的相關性,則協方差接近于零。
二、協方差的計算公式
1. 樣本協方差公式:
$$
\text{Cov}(X, Y) = \frac{1}{n-1} \sum_{i=1}^{n} (x_i - \bar{x})(y_i - \bar{y})
$$
其中:
- $ x_i $ 和 $ y_i $ 是樣本中的第 $ i $ 個觀測值;
- $ \bar{x} $ 和 $ \bar{y} $ 分別是 $ X $ 和 $ Y $ 的樣本均值;
- $ n $ 是樣本數量。
2. 總體協方差公式:
$$
\text{Cov}(X, Y) = \frac{1}{N} \sum_{i=1}^{N} (x_i - \mu_x)(y_i - \mu_y)
$$
其中:
- $ N $ 是總體數據的數量;
- $ \mu_x $ 和 $ \mu_y $ 是 $ X $ 和 $ Y $ 的總體均值。
三、協方差的意義與局限性
| 特性 | 說明 |
| 正值 | 表示兩個變量同向變化 |
| 負值 | 表示兩個變量反向變化 |
| 零 | 表示無線性相關性 |
| 單位依賴 | 協方差的大小受變量單位影響,無法直接比較不同變量間的相關性強弱 |
由于協方差的單位依賴性,通常會使用相關系數(如皮爾遜相關系數)來更直觀地衡量兩個變量之間的線性關系強度。
四、協方差計算示例
假設我們有以下兩組數據:
| 序號 | X值 | Y值 |
| 1 | 2 | 3 |
| 2 | 4 | 5 |
| 3 | 6 | 7 |
| 4 | 8 | 9 |
計算步驟如下:
1. 計算 $ \bar{x} $ 和 $ \bar{y} $:
- $ \bar{x} = \frac{2 + 4 + 6 + 8}{4} = 5 $
- $ \bar{y} = \frac{3 + 5 + 7 + 9}{4} = 6 $
2. 計算每個點的 $ (x_i - \bar{x}) $ 和 $ (y_i - \bar{y}) $:
- (2-5)(3-6) = (-3)(-3) = 9
- (4-5)(5-6) = (-1)(-1) = 1
- (6-5)(7-6) = (1)(1) = 1
- (8-5)(9-6) = (3)(3) = 9
3. 求和并除以 $ n-1 = 3 $:
- $ \text{Cov}(X,Y) = \frac{9 + 1 + 1 + 9}{3} = \frac{20}{3} ≈ 6.67 $
五、總結
| 項目 | 內容 |
| 定義 | 協方差衡量兩個變量之間的線性關系 |
| 公式 | 樣本:$ \frac{1}{n-1} \sum (x_i - \bar{x})(y_i - \bar{y}) $ 總體:$ \frac{1}{N} \sum (x_i - \mu_x)(y_i - \mu_y) $ |
| 意義 | 正值表示正相關,負值表示負相關,零表示無相關 |
| 局限性 | 單位依賴,數值大小難以直接解釋相關性強弱 |
| 應用 | 常用于金融投資組合分析、數據分析等領域 |
通過以上內容可以看出,協方差是統計分析中一個重要的基礎工具,雖然其數值本身不能直接反映相關性的強弱,但它為后續的相關系數計算提供了基礎。掌握協方差的計算方法和意義,有助于更好地理解變量之間的關系。


