icon

FAQ

プロファイリング結果のツイートを眺めた時に挙がっていた疑問などに回答してみました。

  • Q どうやって分析してるの?
    • A 過去約500ツイートに対して はてなキーワード自動リンクAPI という外部サービスを利用してキーワードを抽出し、いくつかの条件を満たした(スコアxx以上など)ワードの属するジャンルのスコアを集計して算出しています。要するに分析の大部分は「はてなキーワード」のシステムまかせです。なお、ワードの数だけではなく、ワードのスコア(ジャンルに対する関連度の濃さ)も加味して集計しているので、ワードの出現率が少なくても濃いワードの場合は影響力が大きくなります。この辺りのさじ加減は利用者の感想ツイートを見ながら調整していく予定です。
  • Q モンハンが「音楽」とか(失望)
    • A はてなキーワードで「 モンハン 」が音楽ジャンルのみに登録されているのが原因です。ゲームジャンルとしても登録されればツイートプロファイリングにも反映されると思いますが、当サービス運営者のはてなアカウントでは修正する権限がありませんでした。心優しいどなたか修正していただけると幸いです。ただ、はてなキーワードで修正された情報がAPIにすぐ反映されるかどうかは分かりません。
  • Q なんでプリキュアが「自然・科学・環境」なんだよwww
    • A はてなキーワードによると「 プリキュア 」というワードは、アニメの他に科学用語としても登録されています(プリキュアのリンクの下の方にあります。当サービスではサイエンスを「自然・科学・環境」と称しています)。ツイートの中での「プリキュア」がどちらの「プリキュア」を指しているのか分からないため、どちらにもカウントしています。「 パシフィック・リム 」が映画以外にスポーツにも該当するのも同じ理由です。前後の文脈を解析するなどをすればそれも特定可能かもしれませんが、そのために費やす労力とそれによって変動するジャンル分類の割合の誤差を天秤に架けた結果、そこまで踏み込んだ解析はしていません。ただこれによってグラフの内容がガラリと変わる事は稀だと思われます。要約すると「そこら辺は目をつぶってちょ」といった感じです。また、「このワードはどのジャンルに分類されてるんだろう」と気になる場合は、 はてなキーワード公式サイト でワード検索すれば分かります。

      追記: 複数ジャンルをもったワードの場合、たまに片方のジャンルだけ取得してくる事があるようです(例: 「 サービス 」がIT・技術だけだったりスポーツだけだったり両方だったり)。正直この辺りの揺れに関しては、仕様説明が これ だけなので良く分かりません。ただ、こちらも結構無茶な使い方をしている自覚はあるので文句を言うつもりはないですが。というわけでこういった複数ジャンルのワードを中心につぶやいている場合は「なんじゃこりゃ?」な結果が返ってくる事があるかと思いますが、そういった時は笑って流していただけると幸いです。

  • Q 「漫画」に関するツイートなんてつぶやいたっけ?
    • A おそらく、上記の理由によって紛れ込んだ複数ジャンルを持ったワードの一部が影響しているものと思われます。
  • Q 「xxxx」なんてワードつぶやいた覚えないぞ?
    • A 対象となるツイートにはあなたがRTしたツイートも含まれています。これは「RTするということはそのツイートに関心がある」という事であり、プロファイリングに影響するものだと考えているためです。逆にリプライは除外しています。リプライは会話的な要素が強いため、「うん」とか「だよねー」などといったプロファイリングに必要ないツイートである可能性が高いと思われます(大雑把な判断ですが)。そういったツイートを500ツイートの中に含めるとプロファイリングが薄くなってしまうと考えているためです。
  • Q ていうかなんでたった500ツイートなのよ?
    • A プロファイリングの待ち時間を考慮したのと、当サービスが内部で利用している「はてなキーワード」のシステムに大きく負担をかけないためです。逆に考えれば「最近のツイートの傾向どうなったかな~」みたいな感じで定期的に覗いてみる楽しみが増えるかもしれません。完全にこちらの都合です。申し訳ありませんがご了承ください。
  • Q おい。エラーばっかり出るぞ。
    • A エラー画面に表示されるエラーコードごとに説明します。

      503

      一度にプロファイリングする利用者の許容量をオーバーしている状態です。当サービスはツイート取得から分析からグラフ作成までほとんどを外部のAPIサービスに依存しています。それらのサービスに過度の負荷をかけないように同時にプロファイリングできる人数を制限させてもらっています。

      401

      ツイッターの認証をキャンセルしたり、何らかの理由で認証ができなかった時に発生します。何らかの理由までは残念ながら特定できません。ツイッター側のサーバーの調子が悪いのかもしれません。

      プロファイリング結果でエラー

      原因はいくつか考えられます。

      1. ツイッターのサーバー、もしくははてなキーワードのサーバーとの通信が上手くいかなかった可能性があります。多くのユーザーが利用するであろう夜などはどのサービスのサーバーも結構がんばっていると思うので発生しやすいかもしれません。
      2. 過去500ツイート分の文章を「はてなキーワード」のシステムのAPIに送るときに不正な文字(アスキーアートで使われる模様のような文字など)が入っているとエラーとなるようです。こちらで事前にそういった文字は除外していますがまだ除外しきれていない文字があるのかもしれません。特定でき次第修正します。

      プロファイリング結果のツイートでエラー

      ツイッターのサーバーとの通信が上手くいかなかった時に発生します。これもサーバーの調子などにより発生します。なお、ツイッターのサーバーが予想外に重くてエラー扱いしたけど実はツイートできてました、という可能性は0ではないので、再チャレンジする時は少しだけ待ってツイートできていない事を確認してからにしていただけると意図しない多重ポストのような事態を防げると思います。

  • Q なんかよくあるスパムくさいんだけど
    • A ログインした際にユーザーから提供される権限へのアクセス情報(トークン)は、プロファイリング結果画面からツイートした場合はそのタイミングで、分析を途中で中断したりプロファイリング結果をツイートせずに画面を閉じた場合は10分間で消去するようにしています。ただこれは第三者から見れば、当サービス側が「こうしています」という自己申告でしかないので、心配であれば、プロファイリングが完了したらあなたのツイッターアカウントの設定画面の「アプリ連携」から「ツイートプロファイリング」を外しておく事をお勧めします。
  • Q ふーん、でもなんでツイッターアカウントの認証時にプロフィールの更新権限なんて要求してんのよ?
    • A ツイッターアカウントの認証に関して、サービス開発者側は大雑把にしか設定できないようになっています。
      1. ツイートやプロフィールなどの情報を取得する
      2. ① + ツイートやフォロー、プロフィールの更新などの何らかのアクションを起こせるようにする
      3. ① + ② + DMなどほぼ全ての権限
      の3段階です。ツイートプロファイリングではプロファイリング結果のグラフ画像を添付したツイートを簡単に投稿できるボタンを用意しており、その機能の実現のために②の権限を認証時に要求しています(ツイートする権限だけ、という設定はできません)。が、TOPページにも表記してある通り、②の中でも画像付きツイートを投稿する以外の権限は一切使用していません(その権限も最長でも10分後に消去します)。また、そのツイートも勝手に行うわけではなく、利用者の意思によって投稿する/しないを選択できます。
  • Q とか言ってるけどアンチウイルスが反応するんだけどどういう事?
    • A はっきりとした原因は分かりませんが、ログインの際にユーザーに要求する権限の中に「ツイートする」などのWrite権限が混じっている事と、当サービスは外部のホスティングサービスを利用してるため、「こいつアカウントハックして逃げるつもりかも」みたいな感じで反応しているのかもしれません(アンチウイルス側のブラックリストに載っているようなサービスがある場合、それと関連付けられてしまっているなど)。もちろんそんなつもりはありません。このサービスは Mashup Awards 9 というWEBサービスのコンテストの応募作品であり、応募に当たって当サービス運営者の個人情報も登録しています。スパムやアカウントハックのような行為をしても即身元が割れて逮捕に至ります。そういったリスクを考えるとそれはありえないと思っていただけると考えています。
  • Q それでもやっぱりログインしたくない。もしくは他の人のアカウントのプロファイリングもしたい。
    • A ログインせずにサーバー内部のアプリケーションアカウントで利用できるTwitter APIの回数では多くのアクセスがあった場合にその回数制限を簡単にオーバーしてしまうため、こういった形にしています。また、ログインなしでプロファイリングできるようにすると、ロボットやツールで一度に何百人・何千人ものアカウントのプロファイリングを行おうとする人が現れてサーバーがパンクし、一般の利用者に影響が出るかもしれません。IPアドレスによる制限など、対応が不可能なわけではありませんが、そこまでしてログイン認証を省くべきかという点において開発サイドとしてはその必要はないと判断しました。理由としては1個前の質問にもあるように、そこまでしてログイン認証方式にして悪事を働くメリットがないことを承知していただけると考えているからです。ご了承ください。

TOPページへ