ウェブマスターツールのhtmlの改善で大量の重複が出ていました。
以前は出ていなかったのですが、仕様変更なのか。WMTではクロールしないようにしていていますが、設定が効いていないようです。
どれもパラメータ付きのurlでとうやらktaistyleのもの。canonicalを設定して防ぐ方法もありますが、個別もarchiveも関係なくすべてのページにパラメータが付いてしまうので、簡単なタグでは処理出来ません。
なので、robots.txtにクロール拒否を記載します。
ついでに、他のパラメータやcomment-page-1も記載。
Disallow: /*?menu=comments
Disallow: /*?menu=months
Disallow: /*?menu=cats
Disallow: /*?menu=tags
Disallow: /*?guid=ON
Disallow: /*?pcview=true
Disallow: /*?img=link
Disallow: /*?cat=
Disallow: /*?view
Disallow: /*?newwindow=true
Disallow: /comment-page-1/
これで暫くほうっておいたら、重複の数が減りました。でも、また数日あとにみると増えていました。余り気にせず気長に待つことにします。なにせインデックス数が5万ページ位あるので。