課題図書は以下のものです。書籍によって、一部の章または一冊全部を担当します。
- 『フェイクニュースを科学する 拡散するデマ、陰謀論、プロパガンダのしくみ』、笹原和俊 著、化学同人、2018年
- 『暴走するネット広告 1兆8000億円市場の落とし穴』、NHK取材班 著、NHK出版新書、2019年
- 『ネット炎上の研究 誰があおり、どう対処するのか』、田中辰雄・山口真一 著、勁草書房、2016年
- 『ネットは社会を分断しない』、田中辰雄、浜屋敏 著、KADOKAWA、2019年
Webスクレイピングと口コミ分析を行いました。
Webスクレイピングとは、Webサイトから特定の情報を抽出することです。今回は、Visual Web ScraperというChrome拡張を使って、「じゃらん」のサイトから観光スポットの口コミを収集しました。Visual Web Scraperを使うと、プログラミングなしで簡単に大量の口コミをスクレイピング可能です。口コミはPythonを使って、年代別や同行者別などに分けてどのような単語が多いか調べました。
ゼミ生の好きな観光スポットを選んでもらい、実際にスクレイピングと分析の演習をしてもらいました。その結果、南知多ビーチランドでは30代が多く家族連れが多いため、イルカショーに関する口コミが多いこと、リトルワールドの口コミからは、女性は衣装、男性は世界観に惹かれていることが分かったようです。
2022年度卒業生のゼミ論文である「YouTuberの今と昔 ―第1世代とZ世代の違いを比較する―」の内容を紹介しました。
この研究では、YouTubeがサービス開始した初期のころのYouTuberと現在のYouTuberの動画を比べています。その結果、動画の長さについては、初期のころは1~2分程度の短いものが多かったものの、最近は20分を超えるものが多く、1時間程度のものもあることが分かっています。サムネイルやタイトルについても変化が起きていることが分かっています。
2020年度卒業生のゼミ論文である「2020年音楽から読み取る日本の社会心情 〜流行歌の歌詞の分析〜」の内容を紹介しました。
この研究は、見田宗介著『近代日本の心情の歴史:流行歌の社会心理史』の手法を参考にして、2000年、2010年、2020年に流行した楽曲151曲の歌詞を対象にモチーフ分析を実行し、その分析結果から日本現代社会の心情を読み解こうとしたものです。
分析の結果、社会意識の変化によって、流行歌のモチーフが変化することが分かったとのことです。
現代人は、「諷刺」「自嘲」「閉塞感」といった悩みの中で「希望」を求めて歌を聴いているのではないかと考察しています。
今回のゼミでは、Hugging Face上の感情分析モデル(Mizuiro-sakura/luke-japanese-large-sentiment-analysis-wrime)を使って歌詞の分析をする演習も行いました。入力したテキストデータから「喜び、悲しみ、期待、驚き、怒り、恐れ、嫌悪、信頼」の8種類の感情を推定できます。歌詞の大まかな感情をとらえることができます。
以下の論文の紹介をして、この論文前半と同じ手順で演習を行いました。
李光鎬「ツイッター上におけるニュースの普及 : どのようなニュースを誰がリツイートするのか」, メディア・コミュニケーション(慶応義塾大学メディア・コミュニケーション研究所紀要), No.65, pp.63-75, 2015年
この論文の前半では、ツイッター上ではどのような内容特性を持つニュースが、よりリツイートされるのか調査しています。具体的には、まず、ニュースツイート60個について、「面白いニュースである」「知っておくべき重要なニュースである」「笑えるニュースである」といった10項目それぞれについて、学生に1~5の5段階で回答してもらっています。そして、それらの平均値とリツイート数との関係を、相関係数、無相関検定、重回帰分析といった手法を使って分析しています。その結果、娯楽的価値が高いツイートほど、より多くリツイートされることが明らかとなりっています。今回は、これらの分析手法の説明をした後、Excelを使って分析の演習をしてもらいました。
近年、データサイエンス・AI教育の重要性が高まっており、本学でも「数理・データサイエンス教育プログラム(MDS)」が開始しています。このゼミでも、データサイエンスの手法について演習を行っていきたいと考えています。