どうも。
メントゥラ事変の影響かどうかわかりませんが、ブログPVガタ落ち、検索流入数減少により、先日つい取り乱した記事を書いてしまいました。
しかし、3日も寝たら何だかどうでもよくなってきました。薄れたというか。睡眠は本当にストレスにいいですね。結局、いろいろ考えても結果は神(Google)のみぞ知るところなので、とりあえずブログには書きたいものを書いていきたいと思います。
さて先日、お○ぱい、ちん○ん連呼の問題の記事が広告を自動停止させられました。その原因を探ったGoogleが嫌うコンテンツのボーダーラインの記事中、使ったらまずかったキーワードとして、
- おっぱい無罪、ち○ちん有罪
という結果を得ました。
しかしこれに対して、Twitterでこんな意見がありました。
私、おっぱいだけなのに、広告でない・・・ / “【お○ぱい無罪!?】AdSense禁止コンテンツのボーダーラインを探る!どんな性的表現テキストがアルゴリズムNGなのか?” http://t.co/afTVItto7j 他1コメント http://t.co/0j6YtZZoGF
— しゅな (@schnein) 2014, 4月 21
で、あしみの(しゅな)さんにそのAdSense広告の出ない記事を教えてもらいました。
@MrYhira おっぱい記事です・・・ (・_・)つ「http://t.co/O6PC9cpgbM」 — しゅな (@schnein) 2014, 4月 21
記事「おっぱいは何を記号しているのか? – あしみの 日記」を見ると、確かにAdSense広告が表示されていません。「ち○ちん」などという言葉は使われていないのにもかかわらずです。
しかし、僕のテストした記事と比べて、あしみの(しゅな)さんの記事は、おっぱいというキーワードが、多いように感じました。実際に数えてみると、あしみのさんの記事は、タイトルに1、本文中に32おっぱいが使われてます。それに対して僕がテストした記事は、タイトルに1、本文中に6でした。
これは何か「数が関係しているのか?」とも考えられます。
そこで今回も興味が出てきたので、Google AdSenseアルゴリズムに対して、ちょっとしたテストをしてみることにしました。
photo by Kliefi
目次
テスト1.単なるキーワード「おっぱい」羅列のアドセンスOKライン
テスト方法
テスト方法はこうです。タイトルに1つおっぱい、本文中に10~50おっぱい使用した記事を作成します。10おっぱいの記事は、こんな感じの記事になります。
こういうのを、本文中の「おっぱい」を10増やしながら5つ作成して、それらの記事にAdSense広告が出るか調査してみました。
結果
半日以上時間を置いた後、結果はこうなりました。
テスト条件(おっぱいの数) | 広告の表示 |
---|---|
タイトルに1、本文に10羅列したもの | セーフ |
タイトルに1、本文に20羅列したもの | セーフ |
タイトルに1、本文に30羅列したもの | セーフ |
タイトルに1、本文に40羅列したもの | セーフ |
タイトルに1、本文に50羅列したもの | セーフ |
なんと!全て広告が表示されました。数だけが問題なのではないようです。ちなみに、本文中に100個羅列したものも公開後、数時間放置してテストしてみましたが、広告は普通に表示されました。
どうやら、単純に数で測れるものではないようです。Googleのアルゴリズムは優秀なので、もしかしたら文章としてちゃんと判断して卑猥度を算定しているのかもしれません。
個人的には、
アドセンス「おっぱいは○個まで」
というハッキリとした基準(1記事あたり)を出したかったのですが、使われているアルゴリズムはそう単純なもんではないようです。
テスト2.あしみのさんの記事のアドセンスOKライン
テスト方法
上のテストだけでは、ちょっと納得いかなかったので、あしみのさんの記事「おっぱいは何を記号しているのか? – あしみの 日記」では何故AdSense広告が出なかったのかも調べさせてもらいました。
手順としてはこうです。
- あしみのさんの記事とタイトルと本文が、全く同じ記事を作成する(デザインが異なってしまうのはしょうがない)
- その記事を、WordPressの「Duplicate Post」というプラグインを使って、いくつか複製
- 少し条件を変えながら人目に触れないようにWordpressで設定して公開
- 1時間以上経ったら、広告が表示されているか確認
もちろん、他人の記事をテストに使うので、万が一にでも検索エンジンなどにも登録されてはいけないので、このように設定しました。
それで、次のような条件の記事を作成してテストしました。(テスト後、記事削除)
- あしみのさんの記事と全く同じタイトル、本文のもの
- タイトルだけ「お○ぱいは何を記号しているのか?」にしたもの
- タイトルだけ「お○ぱ○は何を記号しているのか?」にしたもの
- タイトル変更なし、「おっぱい」出現数5にまで本文の文章を後ろから削ったもの
- タイトル変更なし、「おっぱい」出現数10にまで本文の文章を後ろから削ったもの
- タイトル変更なし、「おっぱい」出現数20にまで本文の文章を後ろから削ったもの
- タイトル変更なし、「おっぱい」出現数30にまで本文の文章を後ろから削ったもの
- タイトル変更なし、「おっぱい」出現数31、本文中の以下のリンクを削ったもの
- タイトル変更なし、「おっぱい」出現数31、本文中の以下のリンクを削ったもの
これらの記事を見えない場所に公開して、1時間後、広告が表示されているかチェックします。ブログのベースが違うので、まったく条件が同じわけではありませんが、ある程度の目安は得られると思います。
結果
これらの結果について、僕の予想からはちょっと意外な結果が出たので報告します。
テスト条件 | 広告の表示 |
---|---|
1.あしみの 日記の記事と全く同じ | NG |
2.タイトルだけ「お○ぱいは何を記号しているのか?」に | NG |
3.タイトルだけ「お○ぱ○は何を記号しているのか?」に | セーフ |
4.タイトル変更なし、「おっぱい」出現数5に | セーフ |
5.タイトル変更なし、「おっぱい」出現数10に | セーフ |
6.タイトル変更なし、「おっぱい」出現数20に | セーフ |
7.タイトル変更なし、「おっぱい」出現数30に | セーフ |
8.タイトル変更なし、「おっぱい」出現数31に「人は~」リンクを削る | セーフ |
9.タイトル変更なし、「おっぱい」出現数31に「おっぱいが~」リンクを削る | セーフ |
今回、➀に関しては、あしみのさんの記事と同じものを使用しているのでNGなのも納得です。
今回のテストの1番の不可思議なところは、➁「お○ぱい」伏字はNG。➂「お○ぱ○」伏字はセーフというところです。「お○ぱい」程度の伏字はGoogleが判断しているともいえる結果です。
あと、本文中の後ろから「おっぱい」が入っている文章1つ削除する(32個~31個にした)だけでセーフとなったのも、わけがわかりませんね。やはり数も多少関係あったのかもしれません。
今回検証対象の「あしみのさんの記事」に限って言えば「本文中おっぱいは31個まで」と言えたのかもしれません。(※書いてある文章の中身によって、この数は変動すると思われます。)
あと、今回のテスト場合は、セーフな状態に記事を修正して数時間放置しても広告が再び表示することはありませんでした。長期間放置しておけば再び表示するのかもしれません。けれど、とりあえずは最初が肝心なようです。
わかったこと
今回のテストで、明確な基準は出すことができませんでしたが、幾つかわかったことがありました。
それを以下にまとめてみました。
- 単純に「おっぱい」キーワードの羅列ではNGにならない(少なくとも100個までは)
- 伏字の「お○ぱい」は、アルゴリズムが認識している可能性あり
- 自然な文章の中の「おっぱい」出現数は広告NGに多少影響している可能性あり
この記事にも、「○」1つだけの伏字「お○ぱい」「ち○ちん」は、かなりあるのでアルゴリズム先生にはわかっているのかも…。
まとめ
さて、この記事中にも「おっぱい」というキーワード(引用込み、伏字除く)は32個出現しています。
この記事の公開から約1時間後、このページにAdSenseから広告が配信されるかは神(Google)のみぞ知るところです。
追記:この記事は広告が表示されるのでアドセンスアルゴリズム的にはOKなようですね。基準が全く分りません。