仮想と現実の真ん中あたり

主に舞台探訪とか聖地巡礼と呼ばれる記録をつづるブログ

『#推し祭り2021 』を横から分析してみる

 先週の6月9日から突然『#推し祭り2021 』というハッシュタグをTL上で見かけるようになりました。NTTソルマーレが運営する『シカロ』というオタ活動向けスケジュール管理アプリのキャンペーンのようで、フォロワーさんもつぶやかれている方がいらっしゃったようです。

 どの作品に投票したかは、公式サイトの内部情報になっていてテキストデータでは見えないのですが、同時にハッシュタグをつけてツイートしているファンの方が多いため、このタグならTwitter APIを使って収集出来るはず、と思いついてやってみました。

『#推し祭り2021 』のハッシュタグ集計結果

 Twitter APIを使ってPythonで取得した結果、下記のツイート,ハッシュタグが収集出来ました。

  ツイート数:178,000 ツイート
  『#推し祭り2021 』以外のハッシュタグ種類:7,504個

 ここで、『#推し祭り2021 』以外のハッシュタグ種類は、作品の数を示していることになるはずですが…。
 いくら何でも7,500作品もあるわけないですよね。実は、この中にはハッシュタグの誤字脱字や表記のゆらぎ(正式名称と略称など),アニメ・コミック以外のジャンル(例:『#なでしこリーグ』等)や『#推し不在』など、さまざまなノイズも含まれてしまっています。
 それでも、上位に入って来る作品はサンプル数が多いためノイズの影響が少ないはずで、「当たらずといえども遠からず」だろう、ということで、エイヤッと1位から50位までを順に並べたものが下のグラフです。



 ※特に順位に数字を振ってないのは、上記したような理由で順位にあまり厳密な意味が無いためです。
 イベント等の推し活動向けというコンセプトのため、女性向けジャンルが強いというのはある程度予想してましたが、それにしても『刀剣乱舞』が2位に倍の差をつけていて、その突出ぶりが目立ちます。
 上位は女性向け優勢で、真ん中ぐらいから定番のアニメ・ゲーム作品が入ってくる印象です。(いい加減な感想なのは、メジャーな対象層から管理人がズレているためなのでご容赦を)
 では、次に51位から100位までを見てみましょう。



 こちらはバラエティーが増えて来て、定番の作品があったり、意外な作品が入っていたりという感じですね。
 『推し活スケジュール管理アプリ』というのは目新しい発想ですが、管理人としては上記の中に入らなかったような作品(『咲-Saki-』とか)も広くカバーしてもらえるとありがたいです。

今回のデータ収集方法について

 今回のツイートの検索・収集条件は下記の通りです。

  • 検索キーワードは、"#推し祭り2021"
  • 検索期間は、2021年6月9日0時0分~6月13日6時0分
  • リツイートは検索しない(Twitterの検索設定は"-filter:retweets")
  • "#推し祭り2021"以外の『#』が付いた単語をハッシュタグとしてカウント

 また、Twitterの検索APIに起因する制約は以下の通りです。

  • 機械的検索の制約
    • 誤字脱字や表記のゆらぎ(正式名称と略称)があると別のハッシュタグとしてカウント してしまう
  • Twitter検索の制約
    • 鍵付きアカウントのツイートは収集出来ない