みなさん、こんにちは!
ブリュの公式ブログ.netにお越しいただきまして、ありがとうございます。
このサイトでは、ITについて特化したサイトを運営しています。
今回は、ロボット認証って何?文字認証やGoogleチェックボックスの意味を解説します!
ちょっとミスしただけでロボットと判定されるあの面倒なシステムですが、何のためにあるのかご存知でしょうか?
インターネット上におけるロボットの意味と、身近に存在しているロボットについて紹介します。
目次
ロボットって何?
インターネットの世界におけるロボットとは、分かりやすく書けば人以外の訪問者のことです。
通常、サイトは誰かに読んでもらうために公開しています。
したがって、サイトは読んでもらえる人のためにあるのです。
しかし、インターネットの世界には、機械的に自動でサイトを訪問するモノも存在します。
こうした、人以外の訪問者のことを、一般的にロボットと呼んでいます。
本来ロボットは歓迎すべきもの!
ロボットは意外と身近に存在しています。
例えば、Googleで検索したときに、キーワードに対して検索結果が表示されますよね。
あれは、Googleのロボットが、サイトを自動で巡回して収集したデータをもとに、検索結果を出力しています。
したがって、検索結果に表示されているサイトは、すべてGoogleのロボットが一度は巡回したサイトになります。
もちろん、ブリュの公式ブログ.net(fot IT)も、検索結果には表示されています。
当サイトの場合、1日当たりGoogleのロボットだけで、1000回近く訪問しています。
※サイトの所有者になれば、Googleサーチコンソールから、ロボットの巡回量を確認することができます。
サイト運営している方ならわかると思いますが、Googleの巡回ロボットをクローラーと言います。
クローラーが訪問した回数、すなわりクロール数が多いほど、インターネット上において重要なサイトであることを意味しています。
クローラーは、リンクを辿っていくことで、新しいサイトを発見していきます。
そんな感じで、Google検索を使うためには巡回ロボットが必要であり、意外と身近な存在であることがご理解いただけると思います。
Googleのチェックボックスは、「ロボット巡回」対策ということで、ロボット自体になんだか怪しいイメージがあるかもしれませんが、本来はロボット巡回は歓迎すべきものなのです。
マナーの悪いロボットも存在する
ここからが本題となります。
ロボットの中には、マナーの悪いロボットも存在するのです。
robots.txtを無視するロボット
ロボットをサーバー側で制御するファイルとして、robots.txtがあります。
このrobots.txtには、サイトマップのアドレスを記載しており、サイトマップにロボットを巡回させることで、サイト内のページに効率的にロボットの巡回させる効果がります。
また、ロボット巡回してほしくないページも明記しておき、そのページにはロボットの巡回を禁止するコードも記載できるのです。
↓robots.txtの例です。
1 2 3 4 5 |
User-agent: * Disallow: /wp-admin/ Allow: /wp-admin/admin-ajax.php Sitemap: https://example.com/sitemap.xml |
しかし、見るなと言われたら見たくなるのが人間ですよね?
robots.txtで見ないようにと書いているページもお構いなしに巡回していくロボットがいます。
これが迷惑なロボットの代表例です。
また、サイト運営にとって価値のないロボット巡回は、基本的にサーバーに負荷をかけるだけなので嫌われます。
だから、「そもそもGoogleなどの検索エンジン用のロボット以外は来るな!」とrobots.txtに書く場合もあるのですが、それでもお構いなしに土足でサイトに踏み込んでくるロボットもいます。
その他には、迷惑なロボットとして、メールアドレスを収集するロボットもいます。
メールアドレスは、「***@***.co.jp」という、特定の形で表されます。
メールアドレス収集ロボットは、サイト内の情報を隅から隅まで探し、メールアドレスの文字列パターンと一致するデーターを抜いていきます。
そのメールアドレス宛に迷惑メールやウイルス付きのメールを送ることで、悪さをしようとしているのです。
よく、メールアドレスが書いているページに、「***★***.co.jp、★を@に変えてください」と書いているのを見ませんか?
これもロボット巡回対策であり、@を★に変えて記載することで、メールアドレスの文字列パターンとの一致を防ぐ効果があります。
Googleチェックボックスの意味
さて、迷惑なロボットの存在をわかったところで、Googleチェックボックスは、どんなロボットを防げるのでしょうか?
主にGoogleのチェックボックスがあるのは、入力フォームがあったり、何かのウェブサービスを提供する場面で多く見ます。
この状況から考えられるのは以下の3つが代表的でしょう。
- スパムの防止
- ウェブサービスの悪用の防止
- ロボットによるサーバーの負荷軽減
ひとつずつ見ていきます。
スパムの防止
入力フォーム、さらにはコメントフォームにおいて、ロボットによるスパムを防止する効果が期待できます。
スパムは迷惑な宣伝行為のことです。
例えば、ブログにコメントフォームを設置していたとしましょう。
スパムロボットは、コメントフォームに迷惑な広告、さらには広告サイトへのリンクを掲載して投稿します。
その結果、広告コメントが、サイト内に表示されてしまうことになります。
こんなスパムによる迷惑行為を防ぐのは、Googleチェックボックスの一つの役目であるといえます。
ウェブサービスの悪用の防止
ウェブサービスを悪用するのを防止する効果も期待できるでしょう。
一番困るのがアカウントの作成です。
何かのウェブサービスを作成するときに、アカウント登録が必要だったとします。
このアカウント登録に関して、ロボットが自動で大量にアカウントを作成したら、迷惑極まりないでしょう。
こんなウェブサービスを悪用するロボットをブロックする効果も期待できます。
ロボットによるサーバー負荷軽減
ロボットはサーバーに負荷を掛けます。
特に、ウェブサービスであれば、サーバー側での処理も多く、サーバーの負荷もそれに伴い大きくなります。
悪質なロボットによって過剰にサーバーへ負荷をかけられると、サーバーダウンからのサービス停止などになり、大きな損害が発生します。
したがって、ロボットを弾くことで、過剰なサーバー負荷を軽減する効果も期待できます。
文字認証の意味
Googleチェックボックス以外でも、ロボットや迷惑行為の排除方法はあります。
例えば、Yahoo! Japanアカウントを作成するときに、文字認証があったりします。
文字認証は、画像で表示された崩れたひらがなを入力するものです。
これの効果についても考えていきましょう。
ロボットにとって文字認証は厳しいらしい
これに関しては聞いた話なのですが、ロボットにとって文字認証はかなり難易度が高いようです。
アルファベットでもかなりの難易度が高いのですが、日本語にすることでさらに難易度を上げています。
その理由が、次に紹介する理由と重なります。
日本語の認証で外国人ハッカーの撃退
日本語認証を用いる一番の理由が、外国人ハッカーの撃退です。
外国人ハッカーで日本語を理解している人は少ないです。
そのため、崩れた日本語を入力させることで、画像以前にそもそも日本語が読めない人を撃退する効果があります。
非常に単純な理由ですが、意外と守備力は高いようです。
WordPressにおいても、セキュリティ系プラグインであるSiteGuardプラグインを使えば、簡単にログイン画面に日本語認証を設置できますので、ハッカーからの防衛のためにも、ぜひとも設置しておくことをお勧めします。
私はロボットではありません?ロボット認証って何?文字認証やGoogleチェックボックスの意味を解説します!
ここまで、ロボット認証についてと、Googleチェックボックスの意味について解説してきました。
ロボット認証と聞くと、なんだか怪しいイメージがありますが、インターネットの世界においてロボットは重要な役割を果たしていることがご理解いただけたと思います。
その中で、マナーの悪いロボット、悪意を持ったロボットを排除するために、googleチェックボックスなどがあります。
いちいち画像認証などがあり、面倒だと感じるかもしれませんが、こういった認証を行わなければGoogle側も大変なことになるのです。
最近ではGoogleもチェックボックスにチェックを入れるだけでロボットかどうかの認証をできるようになり、画像認証の回数も減ってきました。
もっと高性能化してより簡単にロボットを見分けれるようになると、ユーザーにとっても安心感のある世界になっていくでしょう。
もっとも、マナーの悪いロボットが存在しなくなれば一番いいのですが、世界中の人が利用できるインターネットでは、そんなことは無理でしょうから、自衛手段が大切になってきます。
以上、ロボットとGoogleのチェックボックスについて、参考になれば幸いです。