記事検索:

 

重複コンテンツとは?

 

ホームページを運営していると、重複コンテンツの問題にぶつかる事があります。

先に挙げた例のようにECサイトでなくても、無料ブログから独自ドメインを使って運営しようとした場合に、古いURLでのコンテンツを新しいURLでも掲載しようとすれば、重複コンテンツの問題が浮上します。

Googleでは重複コンテンツと見なされると、検索エンジンのデータベースに登録されない事もあります。

データベースに登録されない(インデックスされないとも言います)と、当然検索結果にも出てきませんので、これはきちんと対処しておかねばならない問題です。


ではどんな対処方法があるのでしょうか。

ホーム > iWeb Lab > ホームページ運営 > 重複コンテンツについて

  1. 重複コンテンツについて

まず、重複コンテンツが何なのか?これについて確認をしておきましょう。

例えばECサイトであれば、商品一覧ページに掲載している商品は同じでも、「価格順」か「在庫の豊富な順」かでURLが異なる事がありますね。これが重複コンテンツです。

このサイトはApple iWeb を使用して作成しています。

ご意見などはお問い合わせフォームからお願いいたします。

当サイトは、Yahoo!カテゴリMacintosh > アプリケーションソフト)掲載サイトです。

そもそもrobots.txtでクロールをさせない

重複コンテンツで検索エンジンに登録されなくても良いURLを、robots.txtを使ってクロールそのものをさせない方法があります。

「片一方を検索エンジンに登録しなければ、もう一方が登録されるはず」という方法ですが、重複コンテンツの問題が起きるときは、登録してほしくないページが登録されちゃったりしている場合もあり、この方法で対処できる事は滅多にありませんね。

301リダイレクトを使う

ブラウザや検索エンジンのロボットが、ホームページのあるサーバーにアクセスをすると、HTMLや画像データなどと共に、何らかのステータスコードが返されます。

ページが無い時に返される「404」が一番目にした事があるんじゃないでしょうか。

時々そういったページに遭遇しますよね。そう、あの数字がステータスコードです。


このステータスコードには「恒久的な引っ越し」という意味の「301」というコードが

あります。

つまり「このURLはこっちのURLに引っ越ししたんだよ。もう古いURLは使わないよ」

という意味です。


このステータスコードがブラウザに返ってくると、同時に送られるURLに転送されます。これはGoogleが推奨している方法です。


しかしこの手法は「.htaccess」というファイルを使えるサーバーでなくてはできないので、まず無料ブログなどの無料サービスでは使えない事と、先ほどのECサイトの例で言う「並び順が違うだけ」という重複コンテンツの場合には使えません。

(価格順で並び替えたページから、おすすめ順とかに転送されちゃうので、ユーザビリティ上問題がありますね)

canonicalタグを使う

そこでGoogleが次に推奨するのはcanonincalタグを使う方法です。

これはHTMLの<head>〜</head>に書く特殊なタグで、「このページはこっちのURLが正しいよ」という事を明示するものです。

301リダイレクトのように、勝手に正規のURLに転送されるという事もありません。

これなら無料ブログなどでも使えますし、先ほどのECサイトの例でも使えます。

具体的には、「価格順」「在庫の豊富な順」のURLに対し、「おすすめ順」が正規のURLですよという風に明示する事になります。

こうしておく事で、Googleも重複コンテンツの存在にきちんと気がつき、正規のURLをきちんとインデックスしてくれるという訳です。


canonicalタグは下のように書き、必ず<head>〜</head>の間に書きます。

<body>〜</body>に書いてもGoogleには無視されてしまいます。

<link rel="canonical" href="【正しいページのURL】"/>

最後に・・・Googleは何も重複コンテンツが悪いと言っている訳ではありません。

悪意はなくても発生しうるモノであるという点はきちんと分かってくれています。

しかし、いくらGoogleの検索システムが賢くても「誤解」する事は起こりえます。

そういった誤解を招いて、大事なページが検索エンジンから消されてしまうという事がないように、きちんとルールに則って重複コンテンツが存在する事を明示すべきなのです。