【盗用対策】いち早くGoogleにインデックスさせる方法

f:id:copydetect:20151004133639p:plain

コピーアンドペースト(コピペ)がいとも簡単に出来てしまう今、コンテンツのオリジナル元を判別するのが難しいのも現状であり、自社のコンテンツがオリジナルである事実をWeb上に残す事はコピペ対策の一つであります。

特に自分が作ったコンテンツが無断で他のWebサイトに掲載され、尚且つコピーしたWebサイトの方が、Google検索結果の順位が上位だった..という事も現に発生しています。

GoogleのWeb上の影響力はとても強く、決して自分のコンテンツがオリジナル元であったとしても、多くのユーザーは検索結果の上位に表示されたコンテンツを閲覧します。そこで今回は、Googleにオリジナル元として認識させ、無断転載サイトが不正に上位順位で表示されない様にする方法を紹介したいと思います。

Googleはどのようにして「オリジナル」を認識するのか?

Googleの公式Youtubeアカウントで、Googleがどのようにしてオリジナルを認識するか説明する動画が公開されています。


www.youtube.com

この動画の中でMatt氏は、PageRank等のドメイン・ページ評価値などで順位が決まる、と言いつつ、pubsubhubbubによるページのインデックス高速化を進めています。pubsubhubbubとは、Google社が開発したプロトコルで、新しくWebサイト上にコンテンツを公開した時や、コンテンツ内容を更新した事を素早くサブスクライバーに通知する技術です。

このサブスクライバーにはGoogle等の検索エンジンも含まれる為、Googleクローラーが回遊するのを待つのでは無く、新しいコンテンツを公開した時にページのURLやコンテンツを送信し、出来る限り早くクローラーの回遊を促進する事が出来ます。

Googleはページをインデックス(クローリング)した日時もオリジナル元を考慮する際に利用しているシグナルと言えます。つまり、いち早くGoogleにインデックスされる事が、オリジナル元の情報を残す一つの手段と考える事が出来ます。

(※GoogleボットがWeb上をどのようにクローリングするかを考えると、必ずしもインデックス日時だけがオリジナル元の判断材料とは考えにくいのも事実です。)

Googleにいち早くインデックスさせる方法とは?

では、実際にGoogleにいち早くインデックスさせる(促進)方法を紹介します。

1.Fetch As Google

Fetch As Googleとは、サーチコンソールのいち機能であり、Googleクローラーを指定したURLに強制的にアクセスさせる機能です。

GoogleクローラーがWebページをどのようにレンダリングするか、そもそもクローラーが問題なくアクセスできるか等を確認する為のツールですが、同時にインデックスに送信する事も出来ます。

f:id:copydetect:20151004130740p:plain

サーチコンソールにログインし、クロール>Fetch as Googleを順にクリックします。

f:id:copydetect:20151004131023p:plain

対象となるページのURLをドメイン以降から入力し、最後に「取得」をクリックします。

f:id:copydetect:20151004131204p:plain

Fetch(クローラーによる対象ページコンテンツの取得)が終了すると、一覧表に「インデックスに送信」というボタンが表示されますので、クリックします。

f:id:copydetect:20151004131410p:plain

対象ページのみを取り急ぎインデックス促進させたい場合は、「このURLのみをクロールする」にチェックを入れ、「送信」をクリックします。

「このURLと直接リンクをクロールする」は、対象ページ内に記載がある他ページへのリンク(内部リンク)も同時にクローリングします。

Fetch As Googleは1ヶ月あたりの使用回数に制限があり、「このURLのみ」は500回まで、「URLおよび直接リンク」は10回までとなっています。ページ内のコンテンツを早期インデックス登録促進させたい場合は、「このURLのみ」を選択する方が、制限回数内でインデックス促進できる機会を最大化できると考えられます。

f:id:copydetect:20151004131831p:plain

インデックス登録されたか否かを確認するには、Google検索でURLをそのまま検索するか、site:コマンドもしくはinfo:コマンドを使って確認します。

2.pubsubhubbub

pubsubhubbubは、あくまでも更新した事をビーコンで通知する方法であり、上記で説明したFetch as Googleよりもインデックス登録の強制力はありません。

ただし、毎回サーチコンソールにログインし、URLを入力&投稿するような作業が不要であり、WordpressなどブログCMSに簡単に導入できる為、大量に記事を投稿する場合はコストも下がる為、お勧めの技術実装といえます。

Wordpressの場合は、下記のプラグインが公開されており、気軽に実装できます。

ja.wordpress.org

自社の独自CMSに実装する場合は、下記を参考に導入をお勧めします。

syncer.jp