2023年11月16日木曜日

YouTubeコメントのテキストマイニング

 2019年度卒業生のゼミ論文である「YouTuber 東海オンエアについての考察 ~投稿動画のコメントから東海オンエアの人気を分析〜」の内容を紹介しました。
この研究では、再生回数が多い動画と少ない動画のコメントを分析することで、再生回数が多い動画の特徴を調べました。その結果、視聴者から特に注目されている動画内ポイントとして、メンバーの謎の動き、ふと出た言葉、巧みな言葉選びといったことが指摘されています。
この研究では、学生が目視で3000以上のコメントを1つ1つ確認して分類したため、大変な作業だったと思います。本人が好きなYouTuberだからできた研究と言えます。

今回のゼミでは、YouTubeからコメントを取得して、テキストマイニングする方法を説明しました。テキストデータをコンピュータで定量的に解析し、有用な情報を取り出す技術のことをテキストマイニングと言います。様々なソフトウェアがありますが、今回はKH Coderを用いました。形態素解析して、単語の使用頻度を調べたり、共起ネットワーク図を描いたりすることがプログラミングなしで簡単に行えます。投稿内容の傾向を大まかにつかむことができます。大量のコメントでも、簡単に分析ができます。しかし、詳細な分析をするには人間がコメントを読むしかないでしょう。

2023年9月28日木曜日

4年生のゼミ論文テーマ

4年生ゼミ生にゼミ論文のテーマについてプレゼンしてもらいました。とりあえず今のところのタイトルですが、以下の通りです。
  • ファッションにおけるSNSマーケティングと流行
  • 男女におけるSNS利用の違い
  • Instagramが与える人格形成への影響
  • ネット炎上の変化
  • 芸能人・YouTuber・インフルエンサーの影響力
  • 教育において学生たちは生成AIとどのようにつきあっていくべきか
  • ChatGPTを用いてみる ~現代の若者の「質問力」「要約力」~
  • 戦時中のメディアが国民に与える影響
  • 北陸新幹線沿線の観光促進
  • 志摩スペイン村におけるコラボイベントが消費者に与えた影響
昨年度と同様にSNS関連が多いですが、生成AIに関心を持っている学生も出てきました。
4年2期は各自、調査や制作を行い、ゼミ論文としてまとめてもらいます。また、中間報告や最終発表を行ってゼミメンバー間で情報共有や議論をしてもらいます。
また、昨年度まではWordで執筆してもらいましたが、今年度からはGoogleドキュメントに変更しました。メンバー間で相互に論文を読んで、校正したりコメントを書いてもらったりする予定です。

擬人化企業X(旧Twitter)アカウントの分析

ソーシャルメディアの分析を数回にわたって行っていきます。
今回は擬人化企業X(旧Twitter)アカウントの分析を行いました。いわゆる“中の人”と呼ばれる広報担当者がゆるい運営をしているアカウントのことです。

調査したのは、以下の項目です。自発ツイートは、リプライでもリツイートでもないツイートのことです。

  • リプライの割合
  • リツイートの割合
  • 自発ツイートのテキスト文字数の平均値
  • 自発ツイートにURLが含まれている割合

シャープのアカウントを例に、分析の仕方を説明しました。昨年度まではR言語でツイートを収集していましたがマスクさんのおかげで使えなくなったので、今回は「ついすぽ」を使いました。少し面倒かなとは思いましたが、無事作業ができました。ただ、閲覧ツイート数の制限がかかるので、以前と比べると演習がしずらくなりました。分析はExcelで行いました。今回は、Excelでのフィルターや簡単な関数で行える範囲の分析です。この結果、擬人化アカウントであるシャープのアカウントではリプライの割合が高く、フォロワーとのやり取りを頻繁に行っていることが分かりました。

なお、この調査では、以下の学会発表を参考にしています。

  • 片山桜、土方嘉徳:「Twitterにおける擬人化企業アカウントの特徴分析」、第5回計算社会科学ワークショップ(CSSJ2021)

2023年9月21日木曜日

Webとソーシャルメディアの課題図書

2期の3年生ゼミでは、まずWebとソーシャルメディア関連の課題図書を分担して読んでもらい、内容を紹介するプレゼンをしてもらいます。今回は、その分担を決めました。
課題図書は以下のものです。書籍によって、一部の章または一冊全部を担当します。
  • 『検証 東日本大震災の流言・デマ』、荻上チキ 著、光文社、2011年
  • 『フェイクニュースを科学する  拡散するデマ、陰謀論、プロパガンダのしくみ』、笹原和俊 著、化学同人、2018年
  • 『暴走するネット広告 1兆8000億円市場の落とし穴』、NHK取材班 著、NHK出版新書、2019年
  • 『ネット炎上の研究 誰があおり、どう対処するのか』、田中辰雄・山口真一 著、勁草書房、2016年
  • 『ネットは社会を分断しない』、田中辰雄、浜屋敏 著、KADOKAWA、2019年
どれも良い本ですので、ゼミ生には是非全冊読んでもらいたいものです。

2023年7月13日木曜日

旅行の口コミ分析

Webスクレイピングと口コミ分析を行いました。
Webスクレイピングとは、Webサイトから特定の情報を抽出することです。今回は、Visual Web ScraperというChrome拡張を使って、「じゃらん」のサイトから観光スポットの口コミを収集しました。Visual Web Scraperを使うと、プログラミングなしで簡単に大量の口コミをスクレイピング可能です。口コミはPythonを使って、年代別や同行者別などに分けてどのような単語が多いか調べました。
ゼミ生の好きな観光スポットを選んでもらい、実際にスクレイピングと分析の演習をしてもらいました。その結果、南知多ビーチランドでは30代が多く家族連れが多いため、イルカショーに関する口コミが多いこと、リトルワールドの口コミからは、女性は衣装、男性は世界観に惹かれていることが分かったようです。

2023年7月6日木曜日

GlideによるWebアプリ作成

今回は、GlideによるWebアプリ作成の説明をして、簡単なアプリを作ってもらいました。Glideは、Googleスプレッドシートを利用して、手軽にWebアプリを開発して公開することができるサービスです。プログラミング言語を覚えなくても、例えば、観光地や店舗などの情報を紹介するアプリが簡単にできます。

 

2023年6月29日木曜日

Scratchグループワーク

プログラミング演習として、数回にわたりScratchの実習をしました。Scratchでは、マウス操作でブロックを並べるだけで簡単にプログラミングができます。
基本的な使い方を学んだあと、グループに分かれて作品作成をしました。グループごとに何を作るかアイディアを出してもらい、プログラミングやデザインなどの役割を分担して作品を作ってもらいました。グループごとの工夫が取り入れられていたと感じました。
このうち、一つのキャプチャを載せておきます。木や雲などの背景をスクロールさせることで、キャラクターが歩いているように見えるよう工夫しています。


本ゼミでは、できるだけグループワークを行うようにしています。「情報リテラシー」や「情報システムとAI」といった授業では、学生個人のスキルを上げることが目標ですので、個人での作業ばかりになってしまいます。ゼミでは、グループで作業したり、プレゼンテーションするといった内容を多くしています。

2023年6月1日木曜日

YouTuber第1世代とZ世代の比較

 2022年度卒業生のゼミ論文である「YouTuberの今と昔 ―第1世代とZ世代の違いを比較する―」の内容を紹介しました。
この研究では、YouTubeがサービス開始した初期のころのYouTuberと現在のYouTuberの動画を比べています。その結果、動画の長さについては、初期のころは1~2分程度の短いものが多かったものの、最近は20分を超えるものが多く、1時間程度のものもあることが分かっています。サムネイルやタイトルについても変化が起きていることが分かっています。

今回のゼミでは、YouTuber第1とZ世代に関して、YouTube Data APIを使って動画の長さとタイトルを取得してもらいました。それらをExcelで分析して、世代間の違いをまとめてもらいました。

2023年5月25日木曜日

歌詞の感情分析

 2020年度卒業生のゼミ論文である「2020年音楽から読み取る日本の社会心情 〜流行歌の歌詞の分析〜」の内容を紹介しました。
この研究は、2000年、2010年、2020年に流行した楽曲151曲の歌詞を対象にモチーフ分析を実行し、その分析結果から日本現代社会の心情を読み解こうとしたものです。
分析の結果、社会意識の変化によって、流行歌のモチーフが変化することが分かったとのことです。
現代人は、「諷刺」「自嘲」「閉塞感」といった悩みの中で「希望」を求めて歌を聴いているのではないかと考察しています。

今回のゼミでは、Pythonで感情分析ツール(ML-Ask)を使って歌詞の分析をする演習も行いました。入力したテキストデータから「喜・怒・昂・哀・好・怖・安・厭・驚・恥」の10種類の感情を推定できます。歌詞の大まかな感情をとらえることができます。

2023年5月18日木曜日

KH Coderを用いた歌詞分析演習

以下の論文の紹介をして、同じ手順で演習を行いました。

大出 彩,松本 文子,金子 貴昭「流行歌から見る歌詞の年代別変化」, 人文科学とコンピュータシンポジウム「じんもんこん2013」論文集, pp.103-110, 2013年

この論文では、日本レコード大賞および優秀作品賞受賞曲の計344曲を対象に、年代ごとに表れる歌詞の変化を調査しています。その結果、例えば、1990年代後半から2000年代にかけてネガティブな内容からポジティブな内容へ変化が見られることが示されています。

KH Coderを使って、レコード大賞曲を対象に同様の調査をしました。まずは、論文と同様のコーディングファイルを用いて、コードと年代のクロス集計し、カイ二乗検定結果を確認してもらいました。カイ二乗検定については、先週のゼミで説明と演習を行っています。予定では、コーディングファイルの書き方の説明をして、各自で工夫して新しいコードを追加して分析してもらうつもりでしたが、時間が足りませんでした。

今回の演習で、KH Coderによる分析の仕方に慣れたと思います。

2023年4月27日木曜日

OpenStreetMap現地調査と編集

名駅キャンパス周辺のことを知ってもらうことと、ゼミ生間の交流を図るため、OpenStreetMapの現地調査と編集を行いました。OpenStreetMapは、インターネット上で地図を作るクラウドソーシングプロジェクトです。Googleマップは印刷物を配布する場合などに制限がありますが、OpenStreetMapでは、印刷物の配布やデータ利用を自由に行うことができます。
グループに分かれて名駅キャンパス周辺のお店などの現地調査をしてもらった後、OpenStreetMapへの登録作業をしてもらいました。登録作業はWebブラウザで簡単に行えるため、問題なく完了しました。
本ゼミは教室での演習が中心ですが、たまに外にも出ます。

ニュースツイートに関する統計処理演習

以下の論文の紹介をして、この論文前半と同じ手順で演習を行いました。

李光鎬「ツイッター上におけるニュースの普及 : どのようなニュースを誰がリツイートするのか」, メディア・コミュニケーション(慶応義塾大学メディア・コミュニケーション研究所紀要), No.65, pp.63-75, 2015年

この論文の前半では、ツイッター上ではどのような内容特性を持つニュースが、よりリツイートされるのか調査しています。具体的には、まず、ニュースツイート60個について、「面白いニュースである」「知っておくべき重要なニュースである」「笑えるニュースである」といった10項目それぞれについて、学生に1~5の5段階で回答してもらっています。そして、それらの平均値とリツイート数との関係を、相関係数、無相関検定、重回帰分析といった手法を使って分析しています。その結果、娯楽的価値が高いツイートほど、より多くリツイートされることが明らかとなりっています。今回は、これらの分析手法の説明をした後、Excelを使って分析の演習をしてもらいました。

近年、データサイエンス・AI教育の重要性が高まっており、本学でも「数理・データサイエンス教育プログラム(MDS)」が開始しています。このゼミでも、データサイエンスの手法について演習を行っていきたいと考えています。

2023年4月20日木曜日

文献講読

2023年度は、教科書としてソーシャルメディアに関する書籍を1冊選んで、みんなで講読していきます。各回担当のゼミ生に説明してもらいつつ、関連する議論を進めていきたいと思います。全員、教科書を購入し、毎回予習として授業で扱う範囲を読んで来る必要があります。3年生ゼミと4年生ゼミの教科書は、それぞれ次の書籍です。

3年生ゼミ: 藤代 裕之 編著『フェイクニュースの生態系』青弓社

4年生ゼミ: シナン・アラル 著、夏目大 訳
     『デマの影響力 なぜデマは真実よりも速く、広く、力強く伝わるのか?』
      ダイヤモンド社

今回は文献講読の1回目でしたので、どのような資料を準備してくる必要があるか説明して、第1章の紹介をしました。