若山ゼミブログ: X（旧Twitter）ポストのテキストマイニング

X（旧Twitter）ポストの分析演習を行いました。
SNS上の投稿をはじめとするテキストデータをコンピュータで定量的に解析し、有用な情報を取り出す技術のことをテキストマイニングと言います。様々なソフトウェアがありますが、今回はExploratoryを用いました。形態素解析して、単語の使用頻度を調べたり、共起ネットワーク図を描いたりすることが簡単に行えます。投稿内容の傾向を大まかにつかむことができます。

今回は、Hugging Faceにある日本語BERT感情モデルを使って、ポストの内容がポジティブ・ネガティブ・ニュートラルのどれに該当するか分類する方法も紹介しました。
説明後、Xで自分の興味ある言葉を含んでいるポストを取得してもらい、テキストマイニングしてもらいました。下の図は分析してもらったものの1つです。アメリカ大統領に関するポストの共起ネットワーク図です。ネガティブなポストには、日本メディアによる偏向報道に関するものがあったとのことです。