今朝、原発関連情報の検索に関するこんなニュースを読みました。
原発関連文書に「検索対策疑惑」持ち上がる 「ロ」を「口」、「力」を「カ」に細工したのか : J-CASTニュース
インターネット上で原発関連の情報を検索する際、正しい語句でなく一部を「当て字」にすると、通常の検索では上位に表示されない文書が続々と出てきたと、ネット掲示板やツイッターで報告された。
例えば「ストロンチウム」の「ト」を漢字の「卜(ぼく)」に、「ロ」を漢字の「口(くち)」に書き換えて入力する。「誤表記」にもかかわらず、実際は東京電力や原子力規制委員会、各自治体の文書が並んだ。「不都合な情報を隠すため、当局がわざと文字を置き換えたのではないか」という疑いも出ている。
今回タイトルに書いた「逆SEO対策」と言えば、一般的に「競合するキーワードで上位表示されているライバルサイトにブラックな手法を使ってランクダウンさせる手法」ですが、今回はそういうのではありません。
今回紹介する、「逆SEO対策」は、「社会的義務があって情報を公開しなければならないが、なるべく検索サイトに(上位)表示されたくない」なんて思惑の人たちが使用する手法です。
先程の、ニュースのものは、画像ファイルをOCRで読み込んだ際のトラブルの可能性もあり意図的なものかわかりませんが、結果的に特定のキーワードで上位表示されにくくなっています。(現在は修正されています)
そこで今回は、そういった「自らのサイトを、検索上位表示したくない」なんて思惑の人たちが使う逆SEO手法のまとめです。
目次
キーワード候補に、意味は違うが形が同じ文字を当てる
冒頭紹介した記事の中には、以下のようなキーワードが使われています。
本来のキーワード | 検索よけキーワード | 解説 |
---|---|---|
ストロンチウム プルトニウム |
ス卜口ンチウム プル卜ニウム |
卜→塚原卜伝のぼく 口→くち |
原子力 | 原子カ | カ→カタカナのカ |
MOX燃料 | M0X燃料 | 0→ゼロ |
僕は思いつくものだけで、次のような文字変換が可能と考えられます。
一(漢字の1) | ー(長音記号) |
二(漢字の2) | ニ(カタカナ) |
口(くち) | ロ(カタカナ) |
卜(漢字のぼく) | ト(カタカナ) |
工(漢字のこう) | エ(カタカナ) |
力(漢字のちから) | カ(カタカナ) |
夕(漢字のゆう) | タ(カタカナ) |
日(漢字のひ) | 曰(漢字のいわく) |
厶(漢字のござる) | ム(カタカナ) |
又(漢字のまた) | ヌ(カタカナ) |
へ べ ぺ(ひらがな) | ヘ ベ ペ(カタカナ) |
八(漢字の8) | ハ(カタカナ) |
匕(漢字のさじ) | ヒ(カタカナ) |
特に、漢字とカタカナには似ているものが多いらしくてカタカナに似ている漢字集には、多数の例が載っています。(中には無理やりなものもあるけど)
ただ、やっぱりこれだけじゃ完全な、検索よけにはなりそうにないですね。
けれど、もし不祥事を起こした当事者が「山口慎二」という名前だったら、名前で検索されるのを防ぐために謝罪文に「山ロ慎ニ」(カタカナ)と書くことで検索よけにしても良いかもしれません。
ただ、こういった場合はバレた場合さらに大変なことになることが予想されます。結局は、不祥事の火消しにはならず、火に油を注ぐ結果になるリスクが常につきまといます。
HTMLの代わりに画像を使ってしまう
これは、自社サイトに謝罪文を掲載する時によく使われる手法です。
謝罪文ページを、すべて画像にしてしまうことで文字が検索エンジンにインデックスされることはありません。
例を挙げると、グルーポンおせち問題の外食文化研究所の謝罪文が画像だったり、「アホ男子かるた」を発売しようとした株式会社ユーメイドの「『アホ男子かるた』発売延期のお詫び」なんかもそうでした。
中でも、僕が度肝を抜かれたのが、セクハラで学長が解任され謝罪文を出した上智大短大サイトが丸々1枚の画像になっていたことです。いやマジ、この発想はなかったです。
画像は、個人名にモザイク処理をしてありますが、それ以外はまんまです。当時、上智大のトップページにアクセスしたら、画像がまんまでてきてメニューをクリックしてもどこにも行けない斬新さに驚かされました。
ただ、少し前まではこういった手法も結構使われていたような気がするんですが、最近ではほとんど見なくなりました。上記のように謝罪文を画像にすることで、余計に炎上してしまったりすることもあり、検索エンジンに登録されない以上に不利益になることも多いからではないかと思います。
CSSによりインデックスされない謝罪文を書く
CSSの技法を駆使してインデックスされない謝罪文を作ることができるCSS謝罪文という手法もあります。
CSSに本文を書くことでGoogleでのキーワード検索には引っかからない謝罪文が作れます。
ただ、この手法で謝罪文を出したところは今のところないような気がします。(僕が知らないだけかもしれませんが)
謝罪期間中のみDNSで別サーバーに繋ぐ
乙武さんの「『週刊新潮』の報道について」という謝罪文の時は、以下のような手順が使われました。
- 謝罪文をAWSのS3で構築
- ototake.com ドメインに来るアクセスをDNSでS3に送る
- 謝罪期間が終わると元に戻す(おそらく)
詳しくは、以下の記事が参考になります。
まとめ
いろいろ書いてきましたが、結局検索から多くの人に来て欲しくない場合は、robots metaタグを使って、ページをインデックスさせないのが良いのかもしれません。
<meta name=”robots” content=”noindex,nofollow” />
あと、robots.txtを設定するか。しかし、これらの方法をしても、無視してクロールしてくる検索エンジンもあります。けれど、そういったところは、ユーザーが少ないので無視できるレベルだと思います。
ただ、結局のところ問題なのは「不祥事などを検索エンジンにインデックスさせる/させない」ではなく、「不祥事を真摯に受け止め反省し再発をどう防ぐか」です。
こういった不祥事の1番の対策は、「早急に適切な謝罪文を作り公表し、その後行わなければならないことに素早く対応すること」なんだろうと思います。