2024年11月14日木曜日

X(旧Twitter)コミュニティノートの分析

 X(旧Twitter)には、コミュニティノートという、誤解を招く可能性のある投稿に対し一般ユーザが情報を追記できる機能があります。日本では、2023年7月から利用できるようになっています。2024年1月の能登半島地震の際には、真偽不明や誤りの投稿が多くされて、それらにはコミュニティノートが付きました。このコミュニティノートは全てWeb上でテキストファイルとして公開されており、ダウンロードすることができます。

今回は、能登半島地震の前後5日間のコミュニティノートの件数とどのような内容が多いかテキストマイニングをしました。能登半島地震前は国内のコミュニティノート件数は1日200件程度でしたが、地震後は1日600件になったことが分かりました。ワードクラウドや共起ネットワークを作成して調べることで、地震関連のコミュニティノートが多いことも分かりました。

 

2024年11月7日木曜日

X(旧Twitter)ポストのテキストマイニング

X(旧Twitter)ポストの分析演習を行いました。
SNS上の投稿をはじめとするテキストデータをコンピュータで定量的に解析し、有用な情報を取り出す技術のことをテキストマイニングと言います。様々なソフトウェアがありますが、今回はExploratoryを用いました。形態素解析して、単語の使用頻度を調べたり、共起ネットワーク図を描いたりすることが簡単に行えます。投稿内容の傾向を大まかにつかむことができます。
今回は、Hugging Faceにある日本語BERT感情モデルを使って、ポストの内容がポジティブ・ネガティブ・ニュートラルのどれに該当するか分類する方法も紹介しました。
説明後、Xで自分の興味ある言葉を含んでいるポストを取得してもらい、テキストマイニングしてもらいました。下の図は分析してもらったものの1つです。アメリカ大統領に関するポストの共起ネットワーク図です。ネガティブなポストには、日本メディアによる偏向報道に関するものがあったとのことです。

2024年10月3日木曜日

4年生のゼミ論文テーマ

4年生ゼミ生にゼミ論文のテーマについてプレゼンしてもらいました。とりあえず今のところのタイトルですが、以下の通りです。
  • 紙の書籍と電子書籍の違い
  • 女性アイドルにおける昔と今の楽曲の違い
  • テレビ番組のリアルタイム視聴とインターネット視聴の選択要因の分析
  • ハッキングIoTの個人防止策
  • ゲーム実況動画の視聴がゲームソフトの購買意欲に与える影響について
  • サンリオとうつ病の関係
昨年度まではSNS関連が多かったですが、今年度は幅広いテーマになっています。
各テーマとも、担当の学生の興味や就職先に関わるものです。
4年2期は各自、調査や制作を行い、ゼミ論文としてまとめてもらいます。また、中間報告や最終発表を行ってゼミメンバー間で情報共有や議論をしてもらいます。
論文は、Googleドキュメントで書いてもらいます。メンバー間で相互に論文を読んで、校正したりコメントを書いてもらったりする予定です。

2024年9月26日木曜日

擬人化企業X(旧Twitter)アカウントの分析

ソーシャルメディアの分析を数回にわたって行っていきます。
今回は擬人化企業X(旧Twitter)アカウントの分析を行いました。いわゆる“中の人”と呼ばれる広報担当者がゆるい運営をしているアカウントのことです。

調査したのは、以下の項目です。自発ツイートは、リプライでもリツイートでもないツイートのことです。

  • リプライの割合
  • リツイートの割合
  • 自発ツイートのテキスト文字数の平均値
  • 自発ツイートにURLが含まれている割合

シャープのアカウントを例に、分析の仕方を説明しました。ツイートの取得には「ついすぽ」を使いました。少し面倒かなとは思いましたが、無事作業ができました。分析はExcelで行いました。今回は、Excelでのフィルターや簡単な関数で行える範囲の分析です。この結果、擬人化アカウントであるシャープのアカウントではリプライの割合が高く、フォロワーとのやり取りを頻繁に行っていることが分かりました。その後、いくつかの擬人化・非擬人化アカウントについて調査をしてもらいました。

なお、この調査では、以下の学会発表を参考にしています。

  • 片山桜、土方嘉徳:「Twitterにおける擬人化企業アカウントの特徴分析」、第5回計算社会科学ワークショップ(CSSJ2021)

2024年9月19日木曜日

Webとソーシャルメディアの課題図書

2期の3年生ゼミでは、まずWebとソーシャルメディア関連の課題図書を分担して読んでもらい、内容を紹介するプレゼンをしてもらいます。今回は、その分担を決めました。
課題図書は以下のものです。書籍によって、一部の章または一冊全部を担当します。
  • 『フェイクニュースを科学する  拡散するデマ、陰謀論、プロパガンダのしくみ』、笹原和俊 著、化学同人、2018年
  • 『暴走するネット広告 1兆8000億円市場の落とし穴』、NHK取材班 著、NHK出版新書、2019年
  • 『ネット炎上の研究 誰があおり、どう対処するのか』、田中辰雄・山口真一 著、勁草書房、2016年
  • 『ネットは社会を分断しない』、田中辰雄、浜屋敏 著、KADOKAWA、2019年
どれも良い本ですので、ゼミ生には是非全冊読んでもらいたいものです。

2024年7月25日木曜日

GlideによるWebアプリ作成

今回は、GlideによるWebアプリ作成の説明をして、簡単なアプリを作ってもらいました。Glideは、Googleスプレッドシートを利用して、手軽にWebアプリを開発して公開することができるサービスです。プログラミング言語を覚えなくても、例えば、観光地や店舗などの情報を紹介するアプリが簡単にできます。

 

2024年7月18日木曜日

旅行の口コミ分析

Webスクレイピングと口コミ分析を行いました。
Webスクレイピングとは、Webサイトから特定の情報を抽出することです。今回は、Visual Web ScraperというChrome拡張を使って、「じゃらん」のサイトから観光スポットの口コミを収集しました。Visual Web Scraperを使うと、プログラミングなしで簡単に大量の口コミをスクレイピング可能です。口コミはPythonを使って、年代別や同行者別などに分けてどのような単語が多いか調べました。
ゼミ生の好きな観光スポットを選んでもらい、実際にスクレイピングと分析の演習をしてもらいました。その結果、南知多ビーチランドでは30代が多く家族連れが多いため、イルカショーに関する口コミが多いこと、リトルワールドの口コミからは、女性は衣装、男性は世界観に惹かれていることが分かったようです。

2024年7月4日木曜日

Scratchグループワーク

プログラミング演習として、数回にわたりScratchの実習をしました。Scratchでは、マウス操作でブロックを並べるだけで簡単にプログラミングができます。
基本的な使い方を学んだあと、グループに分かれて作品作成をしました。グループごとに何を作るかアイディアを出してもらい、プログラミングやデザインなどの役割を分担して作品を作ってもらいました。グループごとの工夫が取り入れられていたと感じました。
これまでのグループワークで作成されたプログラムのうち、一つのキャプチャを載せておきます。木や雲などの背景をスクロールさせることで、キャラクターが歩いているように見えるよう工夫しています。


本ゼミでは、できるだけグループワークを行うようにしています。「情報リテラシー」や「情報システムとAI」といった授業では、学生個人のスキルを上げることが目標ですので、個人での作業ばかりになってしまいます。ゼミでは、グループで作業したり、プレゼンテーションするといった内容を多くしています。

2024年6月20日木曜日

YouTuber第1世代とZ世代の比較

 2022年度卒業生のゼミ論文である「YouTuberの今と昔 ―第1世代とZ世代の違いを比較する―」の内容を紹介しました。
この研究では、YouTubeがサービス開始した初期のころのYouTuberと現在のYouTuberの動画を比べています。その結果、動画の長さについては、初期のころは1~2分程度の短いものが多かったものの、最近は20分を超えるものが多く、1時間程度のものもあることが分かっています。サムネイルやタイトルについても変化が起きていることが分かっています。

今回のゼミでは、YouTuber第1とZ世代に関して、YouTube Data APIを使って動画の長さとタイトルを取得してもらいました。それらをExcelで分析して、世代間の違いをまとめてもらいました。

2024年5月23日木曜日

OpenStreetMap現地調査と編集

名駅キャンパス周辺のことを知ってもらうことと、ゼミ生間の交流を図るため、OpenStreetMapの現地調査と編集を行いました。OpenStreetMapは、インターネット上で地図を作るクラウドソーシングプロジェクトです。Googleマップは印刷物を配布する場合などに制限がありますが、OpenStreetMapでは、印刷物の配布やデータ利用を自由に行うことができます。
グループに分かれて名駅キャンパス周辺のお店などの現地調査をしてもらった後、OpenStreetMapへの登録作業をしてもらいました。登録作業はWebブラウザで簡単に行えるため、問題なく完了しました。
本ゼミは教室での演習が中心ですが、たまに外にも出ます。

2024年5月16日木曜日

歌詞の感情分析

 2020年度卒業生のゼミ論文である「2020年音楽から読み取る日本の社会心情 〜流行歌の歌詞の分析〜」の内容を紹介しました。
この研究は、見田宗介著『近代日本の心情の歴史:流行歌の社会心理史』の手法を参考にして、2000年、2010年、2020年に流行した楽曲151曲の歌詞を対象にモチーフ分析を実行し、その分析結果から日本現代社会の心情を読み解こうとしたものです。
分析の結果、社会意識の変化によって、流行歌のモチーフが変化することが分かったとのことです。
現代人は、「諷刺」「自嘲」「閉塞感」といった悩みの中で「希望」を求めて歌を聴いているのではないかと考察しています。

今回のゼミでは、Hugging Face上の感情分析モデル(Mizuiro-sakura/luke-japanese-large-sentiment-analysis-wrime)を使って歌詞の分析をする演習も行いました。入力したテキストデータから「喜び、悲しみ、期待、驚き、怒り、恐れ、嫌悪、信頼」の8種類の感情を推定できます。歌詞の大まかな感情をとらえることができます。

2024年5月2日木曜日

ニュースツイートに関する統計処理演習

以下の論文の紹介をして、この論文前半と同じ手順で演習を行いました。

李光鎬「ツイッター上におけるニュースの普及 : どのようなニュースを誰がリツイートするのか」, メディア・コミュニケーション(慶応義塾大学メディア・コミュニケーション研究所紀要), No.65, pp.63-75, 2015年

この論文の前半では、ツイッター上ではどのような内容特性を持つニュースが、よりリツイートされるのか調査しています。具体的には、まず、ニュースツイート60個について、「面白いニュースである」「知っておくべき重要なニュースである」「笑えるニュースである」といった10項目それぞれについて、学生に1~5の5段階で回答してもらっています。そして、それらの平均値とリツイート数との関係を、相関係数、無相関検定、重回帰分析といった手法を使って分析しています。その結果、娯楽的価値が高いツイートほど、より多くリツイートされることが明らかとなりっています。今回は、これらの分析手法の説明をした後、Excelを使って分析の演習をしてもらいました。

近年、データサイエンス・AI教育の重要性が高まっており、本学でも「数理・データサイエンス教育プログラム(MDS)」が開始しています。このゼミでも、データサイエンスの手法について演習を行っていきたいと考えています。

2024年4月25日木曜日

文献講読

2024年度も教科書としてソーシャルメディアに関する書籍を1冊選んで、みんなで講読していきます。各回担当のゼミ生に説明してもらいつつ、関連する議論を進めていきたいと思います。全員、教科書を購入し、毎回予習として授業で扱う範囲を読んで来る必要があります。3年生ゼミと4年生ゼミの教科書は、それぞれ次の書籍です。

3年生ゼミ: 藤代 裕之 編著『フェイクニュースの生態系』青弓社

4年生ゼミ: シナン・アラル 著、夏目大 訳
     『デマの影響力 なぜデマは真実よりも速く、広く、力強く伝わるのか?』
      ダイヤモンド社

今回は文献講読の1回目でしたので、どのような資料を準備してくる必要があるか説明して、第1章の紹介をしました。

2024年4月18日木曜日

LocalWiki

今週から、ゼミが始まりました。
3年生ゼミでは、自己紹介の後、名駅キャンパスのことを良く知ってもらうためにLocalWikiの演習を行いました。
Wikipediaでは、客観情報・事実情報しか記述できません。それに対して、LocalWikiでは地域の情報を中心に、主観的な情報を記述できるという違いがあります。お勧めのお店や場所などについて、誰でも記載して公開できます。例えば、室蘭のページは大変充実しています。
LocalWikiの説明をした後に、大学のLocalWikiページに名駅キャンパスの情報を追加してもらいました。具体的には、各自で場所を決めて、現地で写真を撮ってきてもらい、その写真を載せて説明を書いてもらいました。新入生や受験生に役に立つような情報を提供していければ良いな、と思っています。

2024年4月1日月曜日

ゼミブログ

2024年度も、このブログでゼミ活動の紹介をしていきます。
文系大学での情報系ゼミということで、何をするかイメージができない人もいると思います。このブログにて、毎回の授業で実施した内容を紹介することで、詳しいことを知ってもらい興味を持ってもらえれば幸いです。
このゼミのことを、Word, Excel, PowerPointといったソフトウェアの使い方を学ぶゼミと勘違いしている人もいますが、これらの基本的な使い方に関する演習は行っていません。道具として用いるので、各自で基本的な使い方ができるようにしておいてください。
関連する科目としては、コース科目「情報システムとAI」、世界教養プログラム応用科目「情報とコミュニケーション」があげられます。本ゼミに興味がある人は、これらの科目を履修することをお勧めします。若山は1年1期「世界理解の方法」の終盤4回も担当しました。そこで説明したインターネット、ソーシャルメディア、人工知能といったテーマも、このゼミの対象となります。
なお、昨年度の4年生のゼミ論文は以下のようなタイトルでした。
  • ファッションにおけるSNSマーケティングと流行
  • 男女におけるSNS利用の違い
  • Instagramが与える人格形成への影響
  • ネット炎上の変化
  • 芸能人・YouTuber・インフルエンサーの影響力
  • 教育において学生たちは生成AIとどのようにつきあっていくべきか
  • ChatGPTを用いてみる ~現代の若者の「質問力」「要約力」~
  • 戦時中のメディアが国民に与える影響
  • 北陸新幹線沿線の観光促進
  • 志摩スペイン村におけるコラボイベントが消費者に与えた影響
全体的に、講義では行えなかった文献講読やグループワークなどの演習を多く取り入れていきたいと考えています。また、授業への参加・受講状況を重視します。遅刻・欠席には厳しく対処します。

2024年1月11日木曜日

ソーシャルメディア分析グループワーク

数回にわたって、Web上の口コミ、Xの投稿、YouTubeのコメントの取得方法と簡単な分析方法について演習を行ってきました。そのまとめとして、グループに分かれてテーマを考えてもらい4週にわたってグループワークを行いました。今回はその発表をしてもらいました。それぞれのグループとも面白いテーマで分析して、興味深い結果を発表してくれました。

その中から1つのグループの発表「坂道グループのそれぞれの強み」を紹介します。乃木坂46、櫻坂46、日向坂46の3グループについて、YouTube動画のコメント欄を分析することで、閲覧者がどのようなポイントについて興味を持っているかをまとめています。次に、各グループの歌詞をテキストマイニングすることで、どのような単語が多く使われているかを比較しています。これらの結果、乃木坂はダンスや歌詞が強み、櫻坂は高い表現力とカッコいい雰囲気が強み、日向坂は元気いっぱいで可愛さが武器のグループとまとめています。担当したアイドル好きな学生も、今回の分析で新たな発見があったと感想を述べています。