2024年11月14日木曜日

X(旧Twitter)コミュニティノートの分析

 X(旧Twitter)には、コミュニティノートという、誤解を招く可能性のある投稿に対し一般ユーザが情報を追記できる機能があります。日本では、2023年7月から利用できるようになっています。2024年1月の能登半島地震の際には、真偽不明や誤りの投稿が多くされて、それらにはコミュニティノートが付きました。このコミュニティノートは全てWeb上でテキストファイルとして公開されており、ダウンロードすることができます。

今回は、能登半島地震の前後5日間のコミュニティノートの件数とどのような内容が多いかテキストマイニングをしました。能登半島地震前は国内のコミュニティノート件数は1日200件程度でしたが、地震後は1日600件になったことが分かりました。ワードクラウドや共起ネットワークを作成して調べることで、地震関連のコミュニティノートが多いことも分かりました。

 

2024年11月7日木曜日

X(旧Twitter)ポストのテキストマイニング

X(旧Twitter)ポストの分析演習を行いました。
SNS上の投稿をはじめとするテキストデータをコンピュータで定量的に解析し、有用な情報を取り出す技術のことをテキストマイニングと言います。様々なソフトウェアがありますが、今回はExploratoryを用いました。形態素解析して、単語の使用頻度を調べたり、共起ネットワーク図を描いたりすることが簡単に行えます。投稿内容の傾向を大まかにつかむことができます。
今回は、Hugging Faceにある日本語BERT感情モデルを使って、ポストの内容がポジティブ・ネガティブ・ニュートラルのどれに該当するか分類する方法も紹介しました。
説明後、Xで自分の興味ある言葉を含んでいるポストを取得してもらい、テキストマイニングしてもらいました。下の図は分析してもらったものの1つです。アメリカ大統領に関するポストの共起ネットワーク図です。ネガティブなポストには、日本メディアによる偏向報道に関するものがあったとのことです。

2024年10月3日木曜日

4年生のゼミ論文テーマ

4年生ゼミ生にゼミ論文のテーマについてプレゼンしてもらいました。とりあえず今のところのタイトルですが、以下の通りです。
  • 紙の書籍と電子書籍の違い
  • 女性アイドルにおける昔と今の楽曲の違い
  • テレビ番組のリアルタイム視聴とインターネット視聴の選択要因の分析
  • ハッキングIoTの個人防止策
  • ゲーム実況動画の視聴がゲームソフトの購買意欲に与える影響について
  • サンリオとうつ病の関係
昨年度まではSNS関連が多かったですが、今年度は幅広いテーマになっています。
各テーマとも、担当の学生の興味や就職先に関わるものです。
4年2期は各自、調査や制作を行い、ゼミ論文としてまとめてもらいます。また、中間報告や最終発表を行ってゼミメンバー間で情報共有や議論をしてもらいます。
論文は、Googleドキュメントで書いてもらいます。メンバー間で相互に論文を読んで、校正したりコメントを書いてもらったりする予定です。

2024年9月26日木曜日

擬人化企業X(旧Twitter)アカウントの分析

ソーシャルメディアの分析を数回にわたって行っていきます。
今回は擬人化企業X(旧Twitter)アカウントの分析を行いました。いわゆる“中の人”と呼ばれる広報担当者がゆるい運営をしているアカウントのことです。

調査したのは、以下の項目です。自発ツイートは、リプライでもリツイートでもないツイートのことです。

  • リプライの割合
  • リツイートの割合
  • 自発ツイートのテキスト文字数の平均値
  • 自発ツイートにURLが含まれている割合

シャープのアカウントを例に、分析の仕方を説明しました。ツイートの取得には「ついすぽ」を使いました。少し面倒かなとは思いましたが、無事作業ができました。分析はExcelで行いました。今回は、Excelでのフィルターや簡単な関数で行える範囲の分析です。この結果、擬人化アカウントであるシャープのアカウントではリプライの割合が高く、フォロワーとのやり取りを頻繁に行っていることが分かりました。その後、いくつかの擬人化・非擬人化アカウントについて調査をしてもらいました。

なお、この調査では、以下の学会発表を参考にしています。

  • 片山桜、土方嘉徳:「Twitterにおける擬人化企業アカウントの特徴分析」、第5回計算社会科学ワークショップ(CSSJ2021)

2024年9月19日木曜日

Webとソーシャルメディアの課題図書

2期の3年生ゼミでは、まずWebとソーシャルメディア関連の課題図書を分担して読んでもらい、内容を紹介するプレゼンをしてもらいます。今回は、その分担を決めました。
課題図書は以下のものです。書籍によって、一部の章または一冊全部を担当します。
  • 『フェイクニュースを科学する  拡散するデマ、陰謀論、プロパガンダのしくみ』、笹原和俊 著、化学同人、2018年
  • 『暴走するネット広告 1兆8000億円市場の落とし穴』、NHK取材班 著、NHK出版新書、2019年
  • 『ネット炎上の研究 誰があおり、どう対処するのか』、田中辰雄・山口真一 著、勁草書房、2016年
  • 『ネットは社会を分断しない』、田中辰雄、浜屋敏 著、KADOKAWA、2019年
どれも良い本ですので、ゼミ生には是非全冊読んでもらいたいものです。

2024年7月25日木曜日

GlideによるWebアプリ作成

今回は、GlideによるWebアプリ作成の説明をして、簡単なアプリを作ってもらいました。Glideは、Googleスプレッドシートを利用して、手軽にWebアプリを開発して公開することができるサービスです。プログラミング言語を覚えなくても、例えば、観光地や店舗などの情報を紹介するアプリが簡単にできます。

 

2024年7月18日木曜日

旅行の口コミ分析

Webスクレイピングと口コミ分析を行いました。
Webスクレイピングとは、Webサイトから特定の情報を抽出することです。今回は、Visual Web ScraperというChrome拡張を使って、「じゃらん」のサイトから観光スポットの口コミを収集しました。Visual Web Scraperを使うと、プログラミングなしで簡単に大量の口コミをスクレイピング可能です。口コミはPythonを使って、年代別や同行者別などに分けてどのような単語が多いか調べました。
ゼミ生の好きな観光スポットを選んでもらい、実際にスクレイピングと分析の演習をしてもらいました。その結果、南知多ビーチランドでは30代が多く家族連れが多いため、イルカショーに関する口コミが多いこと、リトルワールドの口コミからは、女性は衣装、男性は世界観に惹かれていることが分かったようです。