ページ

スクレイピングの被害

実際にスクレイピングの被害にあっている方からの質問です。

質問
私のサイトがスクレイピング被害に遭っております。
下記がスクレイピングページの1つです。
http://www.ksi-nuevo.com/checkup/tehfgafm-j10001-k370361-sdrxzw-wzthnw-gywvfkyv/iobrgq-fsiteh-rnrz-yyuk-gojlt-wivp/
(※既にリンク切れとなっています)

上記のスクレイピングページをデベロッパーツールで確認してみると、
data-feedly-mini="yes"
や、
<iframe src="http://feedly.com/mini.html?
などの記述が見られますが、これはスクレイパーが私のサイトのRSS情報を元にスクレイピングを行っていると考えてよろしいのでしょうか?現在はRSSファイルを全て削除して様子を見ている状況です。


私の回答
スクレイピングはRSSを使っています。
PubSubHubbub使うのがいいと思います。

ちなみに私はBloggerを使っているので心配なしです。


補足
Blogger は Google のサービスなので、Google のサイト評価は正しく行ってもらえます。


質問者さんのコメントと参考意見
プログラミング言語が分からないものですから、非常に助かりました。
であれば、現状行っている対策によって、追加でスクレイピングされる心配はないかもしれませんね。

ちなみにですが、PubSubHubbubはあまり効果的ではないかもしれません。と申しますのも、私もそのプラグインをインストールしたあとにスクレイピングをされ、グーグル側から「複製コンテンツが大量にある」と見なされてインデックス削除を受けてしまったからです。
(※数カ月後に、インデックスは復活しましたが、以前のような検索順位には至っていない状況です)

ただ、私の場合、ハッキングされた世界中のサイト群から一気に大量にスクレイピングされたものですから、かなり特殊な事例なのかもしれません。


参考URL
http://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q14165728499

0 件のコメント:

コメントを投稿