HTTP_USER_AGENT | Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-TW; rv:1.9.1.3) Gecko/20090824 Firefox/3.5.3 GTB5 SV1 |
HTTP_ACCEPT | text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8 |
HTTP_ACCEPT_LANGUAGE | zh-tw,en-us;q=0.7,en;q=0.3 |
HTTP_ACCEPT_ENCODING | gzip,deflate (瀏覽器支援壓縮,這個不一定有) |
HTTP_ACCEPT_CHARSET | Big5,utf-8;q=0.7,*;q=0.7 |
以上 5個資料是正常瀏覽器在觀看網頁時,會產生的變數資料 (以上是 FireFox 3.5的資料)
Server 應該能抓到瀏覽器這五項資料
一般留言機器人只會有 HTTP_USER_AGENT (若無 HTTP_USER_AGENT 那就二話不說,直接擋掉)
其他四個變數則無
判斷留言機器人時,可以檢查五項資料
可以:
1.缺任一項則拒絕留言 (有點過嚴格)
2.缺兩項則拒絕留言
3.缺三項則拒絕留言
常見的垃圾留言格式:
擋掉這種格式的留言I want to thank your page,it good!
<a href="http://gente.chueca.com/toniow/main1.htm?discount-viagra">discount viagra</a>
http://gente.chueca.com/toniow/main1.htm?discount-viagra
[url=http://gente.chueca.com/toniow/main1.htm?discount-viagra]discount viagra[/url]
<a href="http://freud.franklin.edu/ruehle01/_kbas/0000005b.htm?levitra">levitra</a>
http://freud.franklin.edu/ruehle01/_kbas/0000005b.htm?levitra
[url=http://freud.franklin.edu/ruehle01/_kbas/0000005b.htm?levitra]levitra[/url]