Apacheは.htaccessファイルを使用してwgetダウンロードサイトのコンテンツを保護

wgetはrobots.txtのルールに従っていますが、それでもバイパスすることができます。今は自分で使ったシールド方法を共有しています:

1.任意のファイルをブロックする

.htaccess

1
2
3
4
5
6
SetEnvIfNoCase User-Agent "^wget" bad_bot

Order Allow,Deny

Allow from all

Deny from env=bad_bot

2.部分ファイルのダウンロードをブロックする

.htaccess

1
2
3
4
5
6
7
8
SetEnvIfNoCase User-Agent "^Wget" bad_bot
SetEnvIfNoCase User-Agent "^Wget/1.5.3" bad_bot
SetEnvIfNoCase User-Agent "^Wget/1.6" bad_bot
Order Allow,Deny
Allow from all
Deny from env=bad_bot

WeChatパブリックナンバー検索 “スクリプトホーム、注目を集める

プログラム、イベント、書籍の配信、その他のアクティビティがあなたを待っています

コメントを残す