NIKKEI Media Marketing

中央大学

導入事例 Case Study
(前方左から石島氏、大阪大学大学院経済学研究科<br />
 博士後期課程在籍 數見氏、後方は研究室メンバー)

日経新聞の記事データベースをセンチメント分析に活用
-センチメント・インデックスで株価を予測-

中央大学 大学院

国際会計研究科 教授 石島 博 氏

導入しているサービス
  • 新聞記事テキストデータサービス

 ブログやSNSの普及により、そこに集まる大量の書き込みがデータとして注目され、人々の心理や雰囲気といったセンチメントがさまざまな現象にどのような影響を与えたか、各分野で研究が進んでいる。ファイナンス理論、および金融工学を専門とする石島博教授は、センチメントと株価の相関関係に着目し、研究を始めた。そのセンチメント分析のデータとして活用したのが、日本経済新聞の記事である。すでに初期段階の研究を終え、ある程度の相関関係が見えてきたという。また、センチメント分析は、ファイナンスの分野に限らず、あらゆる研究領域の創出が期待できると、今後の可能性を示唆した。

センチメント分析をファイナンス研究に応用したきっかけを教えてください

 景気や株式市場は、実はセンチメント、"見えざる雰囲気"といったものが如実に反映されています。私の専門は、資産のポートフォリオ選択や資産価格評価になりますが、投資戦略決定においては、景気動向が意思決定を左右すると考えられています。そして、その景気動向を大きく左右するのがセンチメントでもあるのです。特に株式市場は、実体経済を先行し、期待値で変動すると考えられています。つまり、センチメントは、その株式市場の現在、そして少し先の将来を先導しうるわけです。そんなとき、アメリカを中心にセンチメントを読み解き、市場や経済を予測しようという研究が流行していると知り、日本語でもやってみたいと思ったのがきっかけです。

 実は、センチメント分析は、古くからアンケート調査によって行われています。政府による景気ウォッチャー調査や日銀短観がそうです。しかし、これらには公表されるまでに時間を要するという欠点があります。大切なのは、生きた経済の「今」を分析することなのです。いかにナウキャストする(今を知る)ことが、現代のファイナンス研究のテーマの一つです。

センチメント分析のソースとして日経新聞を選んだ理由を教えてください

 さまざまなアプローチがあると思いますが、多くのビジネスパーソンが読んでいる日本経済新聞を選択しました。アメリカでは、ウォール・ストリート・ジャーナル(WSJ)やTwitterを利用した研究論文が有名ですが、日経の発行部数はWSJの約1.5倍です。つまり、日経から数値化したセンチメントは、アメリカと比べると、より強く市場に影響を与える可能性があると考えたのです。そこで、日経の約30年分のデータを、新聞記事テキストデータサービスで集めました。その上で、過去約10,920日にわたる、全ての見出しと本文を対象に分析を行いました。

記事はどのように分析されるのですか

 日本語でセンチメント分析するには、一つ厄介な点があります。日本語の場合、英語と違って各単語が独立していません。このため、まず名詞、形容詞、動詞などに振り分ける作業をしなければなりません。最近では、自然言語処理や日本語から有用な情報を抽出するテキスト・マインニングに関する研究が進み、その成果が実装されたソフトウエアも開発され、単語の抽出が容易になりました。抽出された単語には、感情表現辞書を使い感情の点数をつけて日々集計します。そして、日経紙面に反映された感情をスコア化した時系列としてみていきます。

 それから、スコアは見出し、本文それぞれに算出しています。見出しに反応したのか、本文まで読んだうえで反応したのか、あるいはどこのページに掲載されたかという情報もインパクトを測るうえで重要です。

センチメント分析で数値化されたスコアから、どのようなことが分かったのですか

 算出したスコアをセンチメント・インデックスと名付け、それを日経平均株価の株価収益率と照らし合わせると、値動きの幅と直感的に連動しているのが見えてきました。さらに、2008年9月の金融危機前後で、株価収益率とそれを先導するセンチメントの構造が大きく変化した可能性があることがわかりました。

 研究論文では「市場センチメント・インデックスは、2008年9月の金融危機後の期間において、3日後の株価収益率を有意義に説明・予測しうる」と結論づけました。まだまだ、実証分析による手探りの状態ですが、センチメントは株価を含め資産価格の形成に影響を与える新たなファクターになりうると思っています。

『新聞記事テキストデータサービス』についての要望はありますでしょうか

 データはCD-ROMで納品されますが、ネット上で手軽に抽出できるようになると、もっと使い勝手が良くなります。また、すでに一部海外メディアが提供するサービスでは、記事にネガティブ、ポジティブ、ニュートラルのフラグが振り分けられているものもあります。そうするともっと容易にセンチメント分析ができるかもしれません。より多くの研究者が使えるようになると、他分野を含め研究の活性化につながるのではないでしょうか。研究には、まずソースとなるデータベースがなければ始まりませんから。極端なことを言うと、良い研究ができるかどうかは、良いデータベースがあるかないかにかかっています。

今後はどのように発展させていく予定ですか

 もっと長い期間での実証研究も必要ですし、言葉の抽出の仕方、分析の仕方などさまざまなアプローチで研究していく必要があります。現在センチメント分析に用いられている感情表現辞書は、社会学や心理学のために開発されたものなので、ファイナンスに特化した感情表現辞書を開発すれば、さらに精度があがるでしょう。そうして、センチメント・インデックスのモデルが確立されれば、インデックス・ビジネスとして発展する可能もあります。すでに、センチメント分析を活用したファンドが立ち上がったという話もあります。

 それから、センチメント分析自体は、ファイナンスだけでなく、選挙予想、政策・行政評価など、さまざまな分野で学際的な研究領域の創出が期待できます。私も、さまざまな分野の方々とのコラボレーションを積極的に行いたいと考えています。

キャンパス外観

(日経MM情報活用塾メールマガジン12月号 2015年12月3日 更新)

プロフィール

大学名 中央大学
創立 1885年
所在地 東京都八王子市東中野742-1
学生数 26,948人(2015年 5月現在)
学部 法学部、経済学部、商学部、理工学部、文学部、総合政策学部
Webサイト https://www.chuo-u.ac.jp/