# Giving Content to Investor Sentiment:The Role of Media in the Stock Market(媒體在股市的作用) ## 摘要 - 利用wall street熱門的專欄內容,衡量媒體和股市之間的相互作用,該論文發現,媒體的高悲觀情緒預測市場價格的下行壓力,且異常的高或低悲觀情緒可以預測市場交易量的上漲,這些結果與噪音與流動性交易者的理論模型一致 - 且媒體的內容做為資產價值的新訊息代表,作為市場波動的代表或作為與資產市場沒有關係的理論不一致 ## 本文問題:目前還不清楚金融媒體新聞媒體是誘導、放大還是僅僅反映投資者對股票市場的解釋 - 這篇論文描述了媒體報導內容與每日股市活動之間的關係,重點討論華爾街日報中的'Abreast of the Market'ˋ專欄,對美國股市影響 - 利用主成分分析,從華爾街日報專欄中的內容建構一個簡單的媒體悲觀主義 - 且再利用向量自回歸(VARs)來估計這些媒體悲觀變數與股市之間的關係 - 高水平的媒體悲觀情緒可以有效地預測市場價格的下行壓力 - 隨後是基本面回歸,其次媒體悲觀變數異常高級異常低預測了高的市場交易量 - 低市場回報率導致高的媒體悲觀 ### 為什麼選擇華爾街日報 - 華爾街日報是美國發行量最大的日報 - 覆蓋超過325000名金融投資專業人士 - 容易獲得 ### 利用GI - General Inquirer是一個文本分析工具,用於研究文本中的情感、主題、態度和語氣等方面。它最初由Harvard語言研究實驗室開發,是一個計算機化的文本分析工具,旨在將主觀和客觀詞匯與文本的含義和上下文相結合,以產生對文本內容的定量描述。General Inquirer的詞匯庫包含超過11,000個詞匯和詞組,這些詞匯被分類為不同的情感和語氣類別,例如積極、消極、憤怒、悲傷、擔心、偏見等等。使用者可以使用這些詞匯庫來分析文本中不同情感和態度的使用頻率和分布情況。General Inquirer還提供了許多工具和指標,例如頻率計算、詞匯分類和文本分類等,以幫助研究人員進一步分析文本數據。 - 這段文字使用General Inquirer (GI)這個文本分析工具對華爾街日報(WSJ)的“市場概況”欄目進行了16年的分析,從而研究日常投資者情緒的變化。作者通過對GI詞匯庫中的77個詞匯類別進行統計,對每天的報紙數據進行統計,以此來量化報紙中表達的情感和態度。為了提高測量準確度,作者進行了主成分分析,將這77個詞匯類別合併為一個媒體因子(即“悲觀主義因子”),以此來捕捉GI詞匯庫中的最大方差。最終,作者得到了一個能夠反映報紙悲觀情感的悲觀主義因子,並將其用於進一步研究投資者情緒對股市的影響。總之,這段文字利用GI工具對華爾街日報的報道進行了情感和態度分析,旨在探究投資者情緒對股市的影響。 - 在進行主成分分析後,作者得到了一個能夠反映報紙中悲觀情感的因子,並將其稱為“悲觀主義因子”。這是因為,作者在研究中發現,GI詞匯庫中一些與悲觀情感相關的詞匯,例如“恐慌”、“危機”、“下跌”等,對應的負荷量較高,表明這些詞匯在報紙中的使用頻率較高,因此反映了報紙傳遞出的悲觀情感。基於這個原因,作者將這個因子稱為“悲觀主義因子”,用於進一步研究投資者情緒對股市的影響。 ### 附錄:關於77個類別 - 77個類別中包括: 1. Negative,2,291個與負面事件有關的詞語 2. Strong,1,902個暗示力量的詞語 3. Passive,911個暗示被動性的詞語 4. Pleasure,168個表示感受愉悅的詞語 5. Arousal,166個表示興奮的詞語 6. Economic,510個經濟、商業或商務取向的詞語 7. IAV,1,947個解釋行動的詞動詞 8. 等等 - GI可區分出外觀相同但含義不同的詞語之間的微妙區別,例如,詞語“account”在哈佛詞典中有八個不同的條目,分為八個不同的類別。GI通過檢查WSJ列中的單詞上下文,可以識別出“account”的一個介詞形式,五個名詞形式,一個動詞形式和一個副詞形式。當“account”表示“因為”時,如在詞語“on account of”中,GI將其歸類為Causal,其中包括表示一個現象的發生必然先於、伴隨或隨後於另一個現象的詞語。當“account”表示“解釋”時,如在詞語“to account for”中,GI將其歸類為Active,即與積極方向相關的詞語 - GI是一個純詞語計數程序,因此不會將常常具有不同意義的詞語組合進行分類。例如,考慮以下兩個句子:“No, the economy is not strong”和“It is not that the economy is not strong.” GI理解並將這兩個句子中的所有重要詞語進行分類,但純分類計數會認為這兩個句子具有相同的含義。事實上,這兩個句子含義相反。儘管語義和風格噪聲部分遮蔽了基於GI的Wall Street Journal列的解釋,但GI仍然可以提供與列的重要語義組件相關的有趣原始數據。 ## 理論與背景 - Cutler, Poterba, and Summers(1989)最早探討新聞與股票價格之間聯繫的實證之一,但發現作者發現新聞報導似乎並不能幫助解釋重要的新聞似乎不能解釋沒有量化的宏觀經濟事件所帶來的大幅市場回報 - Antweiler and Frank (2004)研究互聯網聊天室關注股票的訊息,確實發現這些資訊波動與交易量與收益之間的關係 - Coval and Shumway (2001)發現期貨市場的環境噪音水平與交易量、波動性、和深度有關,但與收益無關 ### 理論 - 大多數關於投資人情緒對股票市場定價影響的理論模型都有兩個重要的假設 1. 假設有兩類交易者:一種是對未來股利有隨機信念的噪音交易者(他們持有對未來股息的隨機信念,也就是他們的交易決策並不基於實質上的市場基本面,而是受到隨機因素影響的交易者。這種交易行為可能會對市場產生干擾和扭曲。) 2. 理性的套利者 - 作者認為隨著時間的推移,這些噪音不會偏離理性預期 - 其次這些模型假設皆為風險厭惡者,資本有限,無法自由買賣,這個假設導致一個均衡,在這個均衡中,噪音交易者對未來股息的隨機信念會影響價格,具體來說,當這些噪音交易者遇到負面的信念衝擊時,他們會將股票賣給套利者,增加交易量並且收益減少,然而這些衝擊是靜止的 - 低的情緒將產生向下的價格壓力,異常的高或低情緒將產生高的交易量(**作者假設**) - 但其實不僅僅是上述,任何出於非信息原因的交易模型(例如流動性需求或風險規避的突然變化),都會導致相同的結果 ### 為了區分噪音交易者和流動性交易者理論的唯一方法 - 將媒體悲觀主義變數解釋為投資人情緒或風險規避的代表 - 如果媒體悲觀情緒主義變量是投資人情緒的代理,那他可能會影響噪音交易者的交易決策 - 如果媒體悲觀情緒主義變量是風險厭惡的代理,那他可能會影響流動性交易者的交易決策 ### 本論文的具體假設 - 媒體的高度悲觀情緒與投資者的低落情緒有關,導致價格的下降壓力 - 目前還不清楚媒體的悲觀情緒主義是預測了投資者的情緒還是反映了過去的投資情緒 - 如果假設一成立:媒體的悲觀情緒主義是預測了投資者的情緒 1. 可以預測如果媒體的高度悲觀情緒會預測短期內的低收益時期,長期回歸基本面 - 如果假設二成立:媒體悲觀情緒主義是預測了反映了過去的投資情緒 1. 可以預期高媒體悲觀主義情緒會預測預測未來的高收益 ### 但最有可能的兩種理論都有一定道理 - 如果媒體悲觀情緒可以做為過去與未來投資人情緒低的代表 1. 短悲觀情緒伴隨為過去低收益,也伴隨短期未來低收益,而長期預測高收益,且**長期回報超過低的短期回報** ![](https://i.imgur.com/ZBeZ6Vt.png) ### 另一個假設 - 媒體的悲觀主義是關於股票基本價值的負面信息,這些訊息目前未被納入價格 - 如果悲觀主義反映的是關於過去和未來現金流的負面訊息,**而不是情緒**,人們仍然可以觀察到膜體悲觀主地與短期報酬負相關 ### 儘管此論文的重點為:將報紙專欄視為純噪音或純信息的極端觀點 - 專欄本身也有可能包含一些訊息,但交易者對這些訊息反應不足或反應過度,**在第三節實證探討** - 另一個關於悲觀主義的理論為,關於股利的負面訊息代理,這些訊息已被納入價格,故對市場沒有影響(專欄目的為娛樂讀者) ## 資料處理 - GI計算每天專欄中屬於各種單詞的單詞數量,一個詞可能屬於多種類別,有些詞根本沒被歸類 - 為了確保我不會選擇捕捉wsj專欄在一周內系統變化的因素,所以回歸中有使用星期一到日的虛擬變數 - 作者採用主成分分析,這個因素為一個無法直接觀察到的gi類別線性組合(捕捉到gi類別的最大變化) - 幸運的是任何一年估計的媒體因子與其他年的媒體因子非相似,且皆為高度相關 ![](https://i.imgur.com/Ov44ioF.png) - 表一顯示不同年份對gi類別使用pca建構的媒體因子之間相關係數 - 作者在使用主成分分析来识别媒体因子时,只使用t-1年的数据来估计因子加载。然后,作者使用这些加载和t年每天的字数来计算整个t年的因子值。这种方法旨在避免数据挖掘和任何超前偏差,并且确保媒体因子只受到当天信息的影响。然而,由于该过程并不能保证因子加载在不同年份之间的一致性,所以可能会生成一个没有意义的因子。为了检查GI类别中的时间变化是否稳定,作者分析了每年因子使用的加载之间的关系 - 在使用主成分分析识别媒体因子时,作者使用t-1年的数据来估计因子加载。然后,在t年,作者将每天的字数数据与在t-1年估计的因子加载相结合来计算整个t年的媒体因子值。这种方法确保了在t年时只使用t-1年可用的信息,以避免数据挖掘和未来偏差。因此,作者将媒体因子的计算基于历史数据,而不是未来数据,从而提高了因子的可靠性。 - 從因子分析結果可以發現,第一個因子大致上等於對只有4個77個GI類別進行正加權的線性組合:Negative(負面)、Weak(弱)、Fail(失敗)和Fall(下降) - 事實上,Negative和Weak GI類別可以解釋第一因子中超過57%的變異性 - 此因子也負面權重Positive(積極)等類別;但是,因子與Positive詞語之間的負向關係不如因子與Negative詞語之間的正向關係強烈 ### 因此作者用悲觀主義因素來指這個媒體因素 - 事實上,寫作過程通常在收盤時間前就開始了,不太可能包含未接露的訊息 - 故在穩健性測試中,把在下午發表的專欄和和事件回報窗口開始之間引入一個明顯時間間隔 ### 此論文主要進行兩組回歸,以檢驗悲觀主義因素是否在已知的可預測變數之外預測報酬與交易量 1. 第一組回歸中,採用向量自回歸框架(VAR),同時估計報酬、成交量與悲觀主義因素之間的關係 2. 檢驗第一組結果穩健性 3. 評估收益預測性的經濟重要性,以及是否存在有利可圖的交易策略 ### VAR估計 - 了解市場專欄主要關注道瓊指數中的股票 - 故此論文測試悲觀情緒是否能預測道瓊的每日報酬 - DeLong et al. (1990a)認為投資者情緒在小股票的訂價中起到更大的作用,故此論文也考慮市值大小的差異(fama french SMB因子) #### 資料區間:1984/01/01~1999/09/17 - 大概4000筆資料 - 迴歸式: ![](https://i.imgur.com/OPTJFGE.png) - L5(xt) =[xt−1, xt−2, xt−3, xt−4, xt−5] - 主要變數為:Dow指数、媒体情绪因子(BdNws)和交易量(Vlm) - 外生變數(Exo)為:过去5天的波动率、星期和一月份的虚拟变量以及1987年10月19日股市崩盘的虚拟变量 - 作者使用Newey和West(1987)鲁棒标准误来纠正残差的异方差性和自相关性 - 交易量為去趨勢的對數交易量 ![](https://i.imgur.com/Qko5XVp.png) - 表二發現悲觀主義因子的五個滯後期不預測收益的p值為0.006,強烈暗示悲觀主義與未來收益有某種關聯,且悲觀主義因子在統計上和經濟上都有顯著的負面影響 - 研究结果表明,悲观情绪因子对隔日的收益产生了显著的负面影响,其p值小于0.001,t值为3.94,表明影响具有统计和经济上的显著性。当悲观情绪因子发生一标准差变化时,平均对隔日道琼斯指数产生8.1个基点的影响 - 故結論:這種消極影響只是暫時的,交易後幾其幾乎完全反轉,滯後2~5天的逆轉幅度為6.8個基點,在5%水平上顯著異於0 - 故作者拒絕下面假說:沒有反轉的假說和悲觀消息後回報率持續假說 - 但無法拒絕:滯後2~5的6.8個基點完全抵銷 - 最初的下跌和隨後的反轉證據並不支持新信息理論,也不符合新聞專欄的陳舊信息理論 - 如果專欄有出現關於基本面的新信息,回報率會初步下降,並且隨後不會出現完全回報率反轉 - 如果專欄已經包含納入價格的訊息,則不會影響收益 - 但是結果表示投資者的悲觀情緒造成暫時的價格下跌 - 表二的欄二和三分別考察作為悲觀主義因素為基礎的gi詞類negative、weak是否可以作為投資人情緒的代理變數 - 因為如果悲觀主義因素真的是投資者負面情緒的代表,那則有理由期待negative、weak與維來收益有一樣的負面關係 - 表二顯示,negative、weak詞彙每增加一個標準差,就能預測道瓊指數下跌4.4、6個基點,統計上顯著,且negative、weak詞彙增加後,2~5天的逆轉更大 - 故作者結論負面情緒具有顯著的臨時性 ### 利用道瓊指數回報率預測負面情緒 ![](https://i.imgur.com/2fLTAZ5.png) - 如果悲觀主義因素是對專欄內容的合理衡量,則近期經濟變量當然可以預測悲觀主義的值 ![](https://i.imgur.com/tf3MZQ4.png) - 過去的研究表明,金融媒體的報導可能與交易量有關,Shumway (2001)、Antweiler 和 Frank (2004)發現與交易成本、流動性ㄌ和交易量有關 - Campbell 等人 (1993) 的模型提供了另一個悲觀情緒可能與交易量相關的理由 - 簡單來說,假設媒體悲觀情緒的平均值為零,悲觀情緒絕對值較高表示流動性交易者將突然決定買入或賣出股票。市場製造商必須吸收這些流動性交易者對股票的需求,以恢復均衡,這將導致異常高的交易量。因此,高悲觀情緒的絕對值應該預測高交易量,直到流動性交易減少為止 - 如果媒體悲觀主義為交易成本代理的話,理論預測悲觀主義會減少交易量 - 如果媒體悲觀主義為情緒代理,理論預測悲觀主義絕對值會增加交易量 ![](https://i.imgur.com/wHCyhkD.png) - 初步結果支持悲觀情緒是交易成本代理這一觀點 - 作者對1%離群值做調整後,這個結果被薛弱了,故作者不完全排除悲觀情緒的交流和交易量之間有直接聯繫關係 - 但如果經悲觀情緒視為風險規避或情緒的話,從成交量可以得到更多的支持,悲觀主義的絕對值可以顯著預測下一個交易日交易量增加,三欄的結果都成立,代表噪音交易者與鱧性交易者之間的分歧,導致下一個交易日的交易量增加 ### 接下來作者考慮悲觀因素對道瓊以外市場的影響 - 前面有講到,小股票的個人投資者佔比較高,如果悲觀主義者可以衡量個人投資者的情緒,那應該也要可以預測小型股票的回報 - 作者使用了Fama–French small-minus-big (SMB) factor(與道瓊指數相關性不高) - 上面是為了要區別媒體因子是否可以預測小股票的回報,而不是依賴預測道瓊指數 ![](https://i.imgur.com/3vWtx7w.png) ![](https://i.imgur.com/xRTBDg4.png) - 三種悲觀情緒的衡量標準都能顯著預測接下來一周的SMB因子的負面回報,相較於道瓊指數的回報,負面情緒對smb的影響似乎更持久,表五中三個負面情緒在統計和經濟上都是顯著的,因此負面情緒似乎對小型股票更持久,更大的影響 ### 小節:到目前的結果表明,wsj專欄的悲觀情緒顯示著道瓊指數回報率降低,而道瓊指數降低預測悲觀情緒的增加,一個理智的讀者可能會對這些結果抱持懷疑 - 如果wsj下午的專欄(寫於前一個交易日收盤前),包含了沒有完全納入收盤價的晚間訊息,那麼投資者可能會在下一個交易日對專欄中的新聞做出反應,在這種情況下 - 如果下午的華爾街日報專欄(在前一個交易日關閉時撰寫)包含尚未完全納入收盤價格的最新消息,那麼投資者可能會在下一個交易日繼續對專欄中的新聞做出反應。在這種情況下,上述結果通常與傳統金融模型一致,這些模型不考慮流動性或噪音交易者的存在。換句話說,媒體內容作為基本資產價值信息的代理理論可能與上述某些回歸結果一致。在下一節中,作者探討了這種可能性,並報告了其他強健性和敏感性測試的結果。 ## 穩健性測試 - 因為華爾街日報專欄的信息是在下午交易結束時出現,而交易市場在這段時間內已經關閉,因此這些信息在當天的交易價格中可能還沒有得到完全反映。這種時間滯後可能會導致投資者在接下來的交易日中繼續對專欄中的信息做出反應,進而影響到回報和成交量的可預測性結果。 - 作者想要知道悲觀因素的預測能力是集中在盤後到開盤的回報還是均勻的分佈在整個交易日中 - 為了解決這個問題,作者重新估算上述回歸,使用一個更長的回報窗口,讓交易者有更多時間對下午新聞中公佈的信息做出反應 - 作者使用的回報窗口始於當專欄在新聞中發布後的第二天上午10點 - 作者還添加控制變量,在回報回歸中捕捉收盤和開盤回報和成交量的影響 ![](https://i.imgur.com/rgxMh4q.png) - 即使悲觀因素的預測能力來自於其預測投資者情緒的能力,並且均勻地分佈在整個交易日中,但是在從因變量中刪除開盤前和開盤30分鐘回報後,方程式(1)中對悲觀因素的滯後係數應該會下降。這種下降是因為悲觀因素對於預測回報的能力,很可能分散在包括盤後和開盤30分鐘交易的時間段內。實際上,可能是在交易員閱讀下午新聞線或早晨報紙後,悲觀因素對回報產生了最大的因果影響。事實上,紐約證券交易所25%以上的日交易量發生在這個時間範圍內 - 表六結果:對於三種情緒的衡量標準,相比表二係數下降25%, - 本篇文章的研究主要在探討華爾街日報(WSJ)的專欄文章是否能夠預測投資人的情緒,並進一步預測股價報酬率。作者發現,WSJ專欄的情緒指標(如悲觀指標)能夠預測次日道瓊斯指數的報酬率,並且這種預測力不是由流動性交易者或噪聲交易者所引起,而是與基本面價值有關的信息。但作者懷疑,可能存在一個微小的時間滯後,因為WSJ專欄的新聞線通常在下午交易結束時才出現,而這是下一個交易日的報酬率測量期的開始。為了解決這個問題,作者重新進行迴歸分析,用更長的報酬時間窗口來消除時間滯後的影響,發現悲觀指標對於報酬率的預測力仍然存在,而且可能更集中於交易日晚些時候。此外,本文的研究表明,負面情緒能夠預測次日的報酬率,並在隨後的幾天進行反轉,這一點也與交易者慢慢反應信息的假設相矛盾。 ### 重新檢驗悲觀情緒是否為交易成本的代表 - 修改方程式3的交易量定義,改為新聞專欄發布後第二天上午10點至市場收盤時之間發生的交易 - 表7BdBwst-1三個衡量悲觀情緒皆不顯著,也就是說,悲觀情緒並不能直接預測交易量 - 但表7結果表明,悲觀情緒絕對值對第二天回報仍有很大影響 - 對於這三個指標,當情緒高或低於平均值一個標準差時,上午後的交易量會增加1%以上 - 這個結果與Campbell et al. (1993)將悲觀情緒的絕對值解釋為流動性交易者異常高或低的需求,DeLong et al. (1990a)將悲情情緒的絕對值解釋為噪音交易者的需求 ![](https://i.imgur.com/8GFd6hz.png) - 方程式4修改為滯後2~6期的悲觀情緒因素(作者認為小股票價格對信息調整特別慢) - 三種衡量標準全部都強烈的預測中小企業的回報,以統計角度(P<0.002)和經濟角度(大約7個基點),五個系數皆為明顯的負數 - 上述證據表明負面情緒對smb因子的持久且巨大的影響是穩健的 ### 穩健性測試:有理由懷疑負面情緒在特定時期才會更強烈 - 有許多經濟學家認為,20~90世紀的牛市中,市場估值受到非理性繁榮交易者的影響 - 故作者將樣本分為1984~1991,1992~1999,重新估計方程式1 ![](https://i.imgur.com/vX184k3.png) - 1984~1991樣本中,情緒不能預測收益,聯合假設在10%顯著下只能拒絕其中兩個,相比之下1992~1999情緒的最初負面影響和隨後的回到逆轉在經濟上是很大的,並且具有強烈統計意義 - 相較於80年代,90年代似乎主導全樣本的結果 ### 是否有非線性的影響 - 進行局部回歸(Y為道瓊指數的殘差,是來自於回歸的結果) ![](https://i.imgur.com/c7dM7CS.png) - 可發現道瓊收益率隨著負面情緒的增加而單調下降 ### 結果的經濟重要性 - 表二(六)顯示,WSJ專欄的悲觀情緒每增加一個標準差,就可以預測道瓊回報率在第二天會下降,相當於8.1(6.2)(0.081%)個基點,這個效應的經濟意義是非常大的,道瓊在樣本其平均日收益為6.3個基點,會被悲觀情緒的一個標準差增加完全抵銷 ### 試圖利用上述結果進行交易策略 - 作者用Negative words作為負面情緒代理(減少電腦負擔) - 如果負面詞數處於前一年負數詞分布的下1/3,以無風險利率購買道瓊指數的所有股票,並一天後賣回,如果在前1/3,均零成本日報酬為4.4個基點,99%顯著,年化報酬7.3個基點 - 為了進一步檢查其穩健性,在這15年都進行交易策略,發現15年中有12年報酬為正,進一步表示這個策略是穩健和安全的 ### 悲觀因素、消極、脆弱是否與投資者的情緒有關 - negative、weak這兩類捕捉了悲觀因素的大部分變化,所以他們很有可能向讀者傳達相同的思想 - 表二到表八結果支持悲觀主義因素的這種解釋,首先這兩組收益回歸中,negative、weak語詞預測了悲觀主義因素所預測的相同暫時性下跌和逆轉,無論回歸是否包含盤後和開盤半小時的的資料,所有結果在5%顯著在顯著的 - negative、weak的變化能顯著預測成交量的增加,與悲觀主義相比,negative、weak絕對值對第二天成交量增加有略強的作用 - negative、weak類別是該因素在市場上的合理代理 ## 結論 - 上面研究探討了媒體內容與股票市場活動之間的相互影響 - 悲觀情緒的異常高值會引起市場價格的下行壓力 - 悲觀情緒的異常高值或低值會引起市場交易量暫時上升 - 悲觀情緒對價格影響愈乎特別大,而且在小公司中特別慢,與媒體與個人投資者行為有關假設的情緒理論一致 - 悲觀媒體內容之後,市場回報分散在整個交易日,而不是集中在消息發布之後,此外,負面消息後在接下來幾天被逆轉,讓作者懷疑媒體內容的信息解釋 - 悲觀主義對市場波動性增加預測很弱 ### 總之這些結果與認為媒體內容是基於基本面新信息的代表,市場波動的代表或不相關的噪音理論不一致 - 作者還基於上述結果建立交易策略(沒有考慮交易成本),年化報酬獲得超額收益7.3%