如何批量刪除已被百度收錄的死鏈和掛馬黑鏈
網站改版換新內容,但是之前的很多內容都被百度收錄了,現在打開全是404。
前段時間服務器被入侵,掛了很多博彩之類的黑頁,而且全部被百度收錄。現在把漏洞補好了,但刪除黑頁文件以后成了死鏈,要怎么讓百度刪除收錄呢?

在網上找了一下,似乎只有檢測網址是否被收錄的工具,而沒有檢測收錄的是不是死鏈的工具。北京電腦家教 http://www.befwot.tw
福利來了,先在百度找到xenu這個軟件,可以模擬爬蟲爬取所有連接,下載個漢化版。
打開軟件,點新建,關鍵點看這里,不要直接輸入網址,而是輸入下面這句:
http://www.baidu.com/s?ie=utf-8&tn=baidulocal&wd=site%3Awww.befwot.tw,www可以不要,這樣也行:http://www.baidu.com/s?ie=utf-8&tn=baidulocal&wd=site%3Aitjiajiao.com
簡單翻譯一下:查詢百度收錄的網址,包括緩存里的,結尾site加%3A(相當于冒號)加網址,大體是這個意思。
我們先用這個工具查詢所有被收錄的頁面。之所以這樣可以減少鏈接查詢時間和內容。(請把www.befwot.tw換成你的網址)
http://www.baidu.com/s?ie=utf-8&tn=baidulocal&wd=site%3Awww.befwot.tw

等待檢測完成
點擊導出為制表符分隔的文件
導出的文件,我們可以看到格式是:網址+空格+狀態碼

新建一個extcl文檔,然后打開txt,按Ctrl+A全選→ctrl+C復制→打開excel,使用文本導入向導,這樣就會得到一個Excel表格

把狀態碼這一列排序,找到404的url,選中,復制,復制到一個txt文件

上傳到網站空間,再到百度站長平臺死鏈提交填入文件路徑就行就可以

我們知道,思路是通過爬取找出所有被收錄的鏈接,然后按條件列出來而已。這樣的話,只要把開頭輸入的site網址改一下,也可以查詢其他搜索引擎的收錄。
- 上一篇:筆記本重裝系統后黑屏 左上角有一橫杠不停的閃【完美解決】
- 下一篇:沒有了