研究結果與展示
1. 股市爆料同學會情緒統計與視覺化
-
研究資料來源:2024/01/01–2024/12/31,共 30 家資訊服務業公司之討論版文章與留言。
-
情緒分類:快樂(Joy)、憤怒(Anger)、恐懼(Fear)、悲傷(Sadness) 四大情緒。
-
以字典比對情緒詞彙後,統計各公司年度平均情緒分數並製作柱狀圖。
-
快樂情緒指標普遍最高 → 主要原因:
-
情緒字典中快樂詞彙較多,造成判斷偏向快樂。
-
負面情緒表達常含諷刺、反語,字面正向導致模型誤判。
-
2. 情緒指標標準化與代表情緒分類
-
四種情緒分數進行分數標準化後,每日取分數最高者作為「代表情緒」。
-
代表情緒編碼:1=快樂、2=憤怒、3=恐懼、4=悲傷、5=無明確情緒。
-
編碼 5 表示:
-
當日資料量少
-
用字模糊
-
無情緒相關詞彙
-
-
製作範例表說明從原始情緒 → 標準化 → 代表情緒之流程。
3. JASP 統計分析(ANOVA、Post Hoc、描述性統計)
One-Way ANOVA 結果
-
大部分公司:p > 0.05 → 情緒類型對股價影響不顯著。
-
兩家公司例外:2453、6112 → p < 0.05,具有顯著差異 → 情緒可能會影響股價。
Post Hoc(以 2453 為例)
-
ANOVA 結果存在 Excel vs JASP 的差異(需確認資料)。
-
Scheffé 事後比較:所有組別皆不顯著(p > 0.05) → 各情緒組間無明確價差。
描述性統計(Descriptive Statistics)重要發現
-
多數公司各情緒下股價差異小。
-
有明顯反應情緒的例子:
-
2453(凌群):恐懼情緒下均價高於無情緒 → 可能具逆勢特性
-
3029、4994:在「無明顯情緒(5)」下股價明顯下降
-
6112:情緒差異與股價高度相關(ANOVA p < 0.001)
-
6214:呈階梯式下降 → 帶情緒越弱股價越低
-
-
結論:大多個股影響有限,但少數公司與情緒強度高度相關,值得深入研究。
4. JASP 機器學習預測模型
模型:四種監督式學習
-
Decision Tree
-
Logistic Regression(最佳)
-
Random Forest
-
SVM
特徵組合:
-
TI(技術指標)
-
TI + 各類情緒指標(HI/AI/FI/SI)
-
總共 17 種組合
4.1 四種模型整體比較結果
-
綜合 Accuracy、Precision、Recall、F1 → 邏輯迴歸(Logistic Regression)表現最佳
-
隨後分析皆以 Logistic Regression 作主模型。
4.2 以整體資訊服務業為例:情緒指標效果
最佳組合:純技術指標 TI
-
Accuracy = 0.87505
-
F1 = 0.87515(所有組合最高)
加入情緒後反而下降
-
最佳情緒組合為 FI+AI,但仍略低於 TI 單獨使用。
結論:產業層級中,情緒指標對預測幫助有限。
4.3 以單一龍頭公司(精誠)為例:情緒指標效果
最佳組合:TI + FI + SI(恐懼 + 悲傷)
-
Accuracy = 0.8803
-
Precision = 0.8849
-
Recall = 0.8803
-
F1 = 0.8798
次佳組合:TI + HI(快樂)
結論:個股層級中,加入情緒(特別是恐懼/悲傷)可顯著提升預測力。
4.4 綜合比較與推論
整體產業層級
-
最佳模型:純技術指標 TI
-
情緒指標影響小 → 市場整體更依賴技術面(MA、KD、MACD 等)。
個股層級
-
最佳組合:TI + FI + SI
-
個股較容易受到短期情緒波動影響
-
快樂(HI)也具有部分預測力
最終結論
情緒指標在短期、個股層級具有顯著預測力
-
特別是 恐懼(FI)、悲傷(SI)、次要是 快樂(HI)
整體產業層級則以技術指標為主導
-
機器學習模型無法從情緒指標中獲得額外提升
反映出情緒於投資市場的兩層效應:
-
宏觀市場:技術面主導、情緒影響小
-
微觀個股:情緒反應快速,較能影響股價
