2/26/2013

WPの重複ページをインデックスさえないように?img=linkなど

ウェブマスターツールのhtmlの改善で大量の重複が出ていました。
以前は出ていなかったのですが、仕様変更なのか。WMTではクロールしないようにしていていますが、設定が効いていないようです。

どれもパラメータ付きのurlでとうやらktaistyleのもの。canonicalを設定して防ぐ方法もありますが、個別もarchiveも関係なくすべてのページにパラメータが付いてしまうので、簡単なタグでは処理出来ません。

なので、robots.txtにクロール拒否を記載します。
ついでに、他のパラメータやcomment-page-1も記載。


Disallow: /*?menu=comments
Disallow: /*?menu=months
Disallow: /*?menu=cats
Disallow: /*?menu=tags
Disallow: /*?guid=ON
Disallow: /*?pcview=true
Disallow: /*?img=link
Disallow: /*?cat=
Disallow: /*?view
Disallow: /*?newwindow=true
Disallow: /comment-page-1/

これで暫くほうっておいたら、重複の数が減りました。でも、また数日あとにみると増えていました。余り気にせず気長に待つことにします。なにせインデックス数が5万ページ位あるので。