自宅サーバがアタックされそうな予感。

件名の通り。
今日ログをみてみると、怪しげなサイトからのアクセスがある。

2007,01,20,16,24,31,60.28.17.39,www39.asd.tj.cn,
これ。tjk.cnなんて、みたこともないドメインだ。
当然IPアドレスが60.28.17.39判明したので、このドメインのホストがどこにあるのかを、
調査する。

判明。Google Mapでいうところの↓

ここをクリックしたときに表示される地図周辺からのアクセス

中国からのアクセス。しかも、リファラがついていない。もちろんリファラは詐称できるが。
中国や韓国からのアクセスは、とんでもないことが多いらしい。

人民アタック

靖國神社ホームページに対するサイバー攻撃について

というわけで、もちろんサーバを運営していく上ではこういった存在は排除しなければならない。
でも、とりあえず、人民アタックではなく、ドメイン名から、
中国のYahoo!みたいなサービスである「百度」というところからのクローラーらしい。
で、こいつをほっとくと、

中国検索エンジンの百度のクローラーうざいです。

http://parrotlabo.blog87.fc2.com/blog-entry-5.html

百度（baidu)のクローラーはお断り

これをよく調査すると、つまりWebサイトにクローラー（ロボット検索）が来るのを拒否したいときは、robots.txt
をいうのを、良心的なロボット検索システムは読み込んで、拒否されていたらやめてくれる。
行儀の悪いロボット検索システムはそれを無視するらしい。紳士協定といわれている。

で、GoogleやYahooは最大でも数秒に一回くらいしかクロールしないが、百度は、１秒間に９０回以上アクセスしてくるらしい。
サイバーアタックレベルです。
で、百度のページに行くと、きちんとrobots.txtを読みます。と書いてあるのに、実は嘘で、節操無くアタックするらしい。
というわけで、仕方がないので、百度からのアクセスはサーバーレベルで遮断するように設定しないと、いけない。

方法：
サーバーのApacheのhttpd.confに、

SetEnvIf User-Agent Baiduspider robots
<Location />
Order deny,allow
Deny from env=robots
</Location>

を加える。それからhttpdを再起動させる。

というわけで、もっとひどくなった場合は、

韓国からの異常なアクセスを拒否する方法
や、

韓国拒否
を参考にしよう。

今回は早めに気づいてよかったよかった。