2024年5月16日木曜日

歌詞の感情分析

 2020年度卒業生のゼミ論文である「2020年音楽から読み取る日本の社会心情 〜流行歌の歌詞の分析〜」の内容を紹介しました。
この研究は、見田宗介著『近代日本の心情の歴史:流行歌の社会心理史』の手法を参考にして、2000年、2010年、2020年に流行した楽曲151曲の歌詞を対象にモチーフ分析を実行し、その分析結果から日本現代社会の心情を読み解こうとしたものです。
分析の結果、社会意識の変化によって、流行歌のモチーフが変化することが分かったとのことです。
現代人は、「諷刺」「自嘲」「閉塞感」といった悩みの中で「希望」を求めて歌を聴いているのではないかと考察しています。

今回のゼミでは、Hugging Face上の感情分析モデル(Mizuiro-sakura/luke-japanese-large-sentiment-analysis-wrime)を使って歌詞の分析をする演習も行いました。入力したテキストデータから「喜び、悲しみ、期待、驚き、怒り、恐れ、嫌悪、信頼」の8種類の感情を推定できます。歌詞の大まかな感情をとらえることができます。

2024年5月2日木曜日

ニュースツイートに関する統計処理演習

以下の論文の紹介をして、この論文前半と同じ手順で演習を行いました。

李光鎬「ツイッター上におけるニュースの普及 : どのようなニュースを誰がリツイートするのか」, メディア・コミュニケーション(慶応義塾大学メディア・コミュニケーション研究所紀要), No.65, pp.63-75, 2015年

この論文の前半では、ツイッター上ではどのような内容特性を持つニュースが、よりリツイートされるのか調査しています。具体的には、まず、ニュースツイート60個について、「面白いニュースである」「知っておくべき重要なニュースである」「笑えるニュースである」といった10項目それぞれについて、学生に1~5の5段階で回答してもらっています。そして、それらの平均値とリツイート数との関係を、相関係数、無相関検定、重回帰分析といった手法を使って分析しています。その結果、娯楽的価値が高いツイートほど、より多くリツイートされることが明らかとなりっています。今回は、これらの分析手法の説明をした後、Excelを使って分析の演習をしてもらいました。

近年、データサイエンス・AI教育の重要性が高まっており、本学でも「数理・データサイエンス教育プログラム(MDS)」が開始しています。このゼミでも、データサイエンスの手法について演習を行っていきたいと考えています。