読者です 読者をやめる 読者になる 読者になる
 

コピーコンテンツ?重複コンテンツ?SEOにおける不要インデックスについてまとめてみました

▮ 不要インデックスとは何?

f:id:copydetect:20151216205941j:plain

不要インデックスとは、検索エンジンにインデックスさせる必要のないコンテンツのことで、検索エンジンから正しく評価を受け、オーガニック流入を最大化するためには、インデックス排除することが望ましいコンテンツを指します。
内容が重複してしまっているページや、オリジナルの情報が無いページ、ユーザーにとっては必要でも検索結果に表示する必要のないコンテンツ等が該当します。
オーガニック検索経由の流入獲得に貢献しないばかりではなく、サイトの評価全体の低下にもつながります。
直接ユーザーに関係ないからと軽視されるWEBマスターの方もなかにはいるのですが、きちんと対策することが出来れば、サイトが本来得られるはずの流入を、継続的に獲得していくことが可能です。
1)重複コンテンツ
コンテンツの内容が完全に一致するもの、あるいはほぼ同じであるコンテンツのことを指します。
ECサイトやDB系の情報サイトなどで、サイト内検索の結果ページをインデックス対象としている場合などは、かなりの確率で重複コンテンツが発生しています。
例えばファッションECの事例で言えば、フリーワード検索で「トレンチコート」と検索した際の検索結果画面と、カテゴリ一覧から「トレンチコート」を選択した際のコンテンツ内容が、完全に重複しているにも関わらずURLは別のものが表示されるケースなどがあります。
または一覧ページを並び替えただけのページ群が、表示形式を指定するパラメータ等により別々のURLを持つことで、大量の重複 コンテンツが発生してしまうといったこともよくある事例です。
2)コピーコンテンツ
コピーコンテンツとは、文字通り他サイトのコンテンツをコピーしたコンテンツという意味で、オリジナルの情報が無く(少なく)、他サイトと重複する情報が占める割合が多いものが該当します。
(参照:https://support.google.com/webmasters/answer/2721312
Googleが定めるガイドラインにおいては「低品質コンテンツ」というカテゴリーに分類されており、もちろん不要インデックスにも該当します。
気を付けなければいけないのは、コンテンツマーケティングが隆盛する中で、
意図的でなくとも自サイトのコンテンツがコピーコンテンツと判定されてしまうケースも発生しています。
* 偶然記事が重複してしまうケース(非常に稀)
* ライターがコピーコンテンツを納品してくるケース(非常に多い)
3)情報の量が少ないページ
ページの中に情報が極端に少ないものや、まったくコンテンツが存在しないページ等は、不要インデックスに該当しますので排除する必要があります。
該当する情報が無かった検索結果ページ(弊社では「0件ページ」と呼んでいます)や、特定のカテゴリ一に該当するコンテンツが少なく一覧ページのコンテンツ量が少ないなどの場合が事例として挙げられます。
4)検索結果には必要ないコンテンツ
応募フォームページや、買い物かご(カート)、ログイン画面や管理画面など、ユーザーがサイトを利用する上では無くてはならないページでも、検索エンジンにとっては不要なページというものが存在します。

▮ 不要インデックスがデメリットになるのはなぜ?

f:id:copydetect:20151216210001j:plain

不要インデックスがあることのデメリットは、期待流入の損失につきます。
評価の分散や下落、インデックス化率の低下によって、サイトが本来であれば受けられた評価が減損してしまう可能性があります。
1)サイト評価値の分散
特定の検索クエリに対応するコンテンツが重複して5つ存在していた場合、本来であれば1つのコンテンツで100の評価が得られる所が、10・20・10・40・20といったように分散してしまう可能性があります。
もし100の評価を受けていれば1ページ目に表示できたかもしれないコンテンツが、重複によってクリック圏外の順位になってしまうかもしれないということです。
実はGoogleの検索エンジンBotは、重複しているコンテンツを発見した場合、そのうちの1ページに評価をまとめてくれる場合があります。
(参照:http://googlewebmastercentral.blogspot.jp/2007/09/google-duplicate-content-caused-by-url.html
Googleとしては同じ検索結果画面の中に、重複したコンテンツが存在してしまうと困るという理由がある為、上記のような仕様で処理をしているようです。
ただ、困ったことに、
・常に完璧に働くわけではないこと(重複コンテンツがすべて発見されない等)
・ユーザーが意図した代表ページに必ずしも評価がまとまるわけではない
といった理由から、評価値の分散を完全に避けることは出来ないようです。
2)パンダアップデートによる評価下落
パンダアップデート以降、Googleは質の低いコンテンツ(ページ)の評価を下げる傾向を強めています。
(参照:http://searchengineland.com/library/google/google-panda-update
各ページの評価が、それぞれ20、30、50のサイトの総合評価は100になるはずですが、
このうち1つのコンテンツが低品質と判断された場合、-10、30、50の合計値として総合評価は70になってしまいます。
低品質を受けているコンテンツを排除すると、総合評価は80(30+50)になりますので、実質上全体の評価は上昇します。
尚、低品質なコンテンツのインデックスについての対策する場合、
インデックスを排除するという方法以外にも、コンテンツを追加ないし1ページにまとめるなどの判断もあります。
3)インデックス化率低下
不要なインデックスが大量にあると、サイト全体のインデックス化率が下がってしまい、良質な(Googleから高い評価を受けられる)コンテンツがインデックスされなくなってしまう問題が発生することがあります。
当然GoogleBotも無限にサイトを回遊出来るわけではない為、重複コンテンツが多い場合などはクロールするページ数に制限を設ける可能性があります。
(参照:https://youtu.be/dP45YYidXUM
その結果としてインデックス化率が低下することがありますので、大量にページが生成されるサイトの場合で、なかなかページのインデックスが進まない場合は、不要インデックスの削除を検討する必要があるかもしれません。

▮ まとめ

以上のように不要インデックスがあることは、サイトが本来受けられる評価値を分散させてしまったり、評価の総合値を減少させてしまったりと、ネガティブな影響をサイトに対して与えてしまいます。
逆に考えれば、不要インデックスを正しく排除することによって、サイト本来の評価を取り戻し、最大限の流入を獲得することが出来るようになる可能性があるということでもあります。
大規模サイトやDB系のWEBを運営されている方は特に、本来得られる流入を損なっている可能性がありますので、もう一度不要なインデックスが大量に発生していないかチェックして頂ければと思います。