作業明明都是在迴歸,怎麼突然出現一題要檢驗什麼5%、10%的,問 ChatGPT 它又提到 t,t 到底是什麼東西我好矇啊😱😱!
t 值其實只是在回答一個問題:
👉 「這個數字,跟 0 比起來,有沒有大到不能當作誤差?」
一、t 值在幹嘛
你現在有兩個東西:
係數:0.321(你看到的影響)
標準誤:0.216(這個數字有多不準)
👉 t 值就是在算:「這個影響,是誤差的幾倍?」
二、公式其實只是這樣
t = 估計值 / 不準程度👉 t = 係數 ÷ 標準誤
三、你可以這樣記
👉 t 值 = 「訊號 / 雜訊」
四、一句話記住
👉 t 值 = 這個效果「有多明顯」
啊剛剛提到的標準誤又是什麼?
一、標準誤在幹嘛
👉 標準誤 =「這個係數有多不穩定」
想像你一直重抽資料(不同公司、不同樣本),每次都重跑回歸:
有時候 β = 0.30
有時候 β = 0.40
有時候 β = 0.20
👉 會「飄來飄去」
標準誤就是在量:這種「飄動的程度」
二、超白話定義
👉 標準誤 = 如果你重做很多次實驗,這個係數大概會偏離多少
三、為什麼會有標準誤?
因為你只有一份資料(樣本),不是全世界的資料。
👉 所以你的係數只是「估計值」,不是絕對真實
四、怎麼算(概念)
標準誤會變大或變小,主要看三件事:
1️⃣ 資料多不多
👉 資料越多 → 越穩 → 標準誤越小
2️⃣ 資料亂不亂
👉 資料很散 → 很不穩 → 標準誤變大
3️⃣ 模型好不好
👉 如果變數沒解釋力 → 標準誤變大
五、跟 t 值的關係(連起來)
t = 係數 / 標準誤👉 所以:
標準誤小 → t 大 → 比較顯著
標準誤大 → t 小 → 不顯著
係數、標準誤和 t 值的關聯:
t 檢定
後來我又有個疑問:這裡的 t 值跟 t 檢定有什麼關係?
一句話先講清楚
👉 回歸裡的 t 值 = t 檢定的一種(完全同一套邏輯)
一、t 檢定在做什麼
一般你學的 t 檢定:
👉 檢查「某個數是不是等於某個值」
例如:
平均數 = 0 嗎?
兩組平均有差嗎?
二、回歸裡的 t 在做什麼
👉 檢查:某個係數 = 0 嗎?
三、對照一下
👉 公式其實一樣:
t = (估計值−假設值) / 標準誤t 分配
t 分配又是什麼鬼?
一句話先講清楚
👉 t 分配 = 用來判斷 t 值「算不算大」的標準
t 分配在幹嘛
因為你用的是「樣本」,不是全部資料。
👉 如果你換一批資料,算出來的 t 值會變來變去
想像你一直重做實驗
每次都:
抽一批公司
跑回歸
算 t
可能會變成:
因為資料本身有隨機性:
抽到不同公司
資料有雜訊
模型不完美
👉 所以結果不會一樣
t 分配告訴你:「在正常情況下,t 值通常會落在哪裡」
👉 就是在描述:「如果一直重做,t 會怎麼亂跳」
t 分配怎麼來(直覺版)
如果我們:
👉 假設「其實沒有影響(β=0)」
👉 重複做很多次實驗
就會得到一堆 t 值:
0.3, -0.8, 1.2, 0.5, -1.1, 2.0, ...👉 把這些畫成圖
→ 就會形成一個分布
👉 這個分布就是:t 分配