目前,被站長廣為使用的禁止百度收錄的方式共有三種:
robot文件:搜索引擎爬蟲指令
搜索引擎使用一種抓取程序(robots),訪問互聯網中的網頁信息。
通過在網站中創建一個純文本文件robots.txt:聲該網站中不想被robot訪問的部分,這樣,該網站的部分或全部內容就可以不被搜索引擎收錄了,或者指定搜索引擎只收錄指定的內容。
1、不想讓搜索引擎來追蹤此頁面上的鏈接同時也不傳遞權重,在<haed>部分加入標簽:<meta name="robots" content="nofollow">;
2、讓百度追蹤頁面中的其中一條指定鏈接使用方法如:<a href="signin.php" rel="nofollow">蘇州seo</a>;
3、允許除百度外的其他搜索引擎抓取同時防止百度對網頁鏈接的跟蹤也是將這個標記插入到網頁的<HEAD>部分使用方法:<meta name="Baiduspider" content="nofollow">
noarchive:此標簽作用是禁止搜索結果中顯示網頁的快照時間。
禁止所有搜索引擎顯示網址的快照時間,將此標簽插入到網頁的<HEAD>部分例如:<meta name="robots" content="noarchive">;
只讓顯示除了百度之外的搜索引擎顯示快照標簽使用方法:<meta name="Baiduspider" content="noarchive">
SEO知否提醒:這個標記只是禁止百度顯示該網頁的快照時間,百度還會繼續為網頁建索引,同時在用戶搜索的結果中展現出網頁的摘要。