這么久時間過去了,排名還是沒有,說明被百度降權(quán)的域名想恢復(fù)是多么不容易,很多站長網(wǎng)站被降權(quán)后,做了很多補救工作,希望可以恢復(fù),其實,我想百度數(shù)據(jù)庫肯定有無數(shù)的降權(quán)域名,想單單把你的域名拿出來恢復(fù)權(quán)重幾乎是不可能的,其實有一種有效的補救措施,不過代價比較大,就是被降權(quán)的域名直接不要了,換新的域名。
前天我做了一個嘗試,注冊了新域名 zui88.com ,把原來的域名zui88.com進行301重定向,到了第二天新域名zui88.com被收錄,并且大部分關(guān)鍵詞排名恢復(fù),然后服務(wù)器被關(guān)閉,因為新域名沒有備案,今天正式把網(wǎng)站遷移到香港服務(wù)器,以后就使用新域名,老域名就做轉(zhuǎn)向用了。有待測試??!
]]>
1,網(wǎng)站上線時必須至少有一點原創(chuàng)內(nèi)容支撐,可以先發(fā)一些新聞產(chǎn)品,公告通知,技術(shù)知識的文章,保障網(wǎng)站不會太空洞,避免完全復(fù)制網(wǎng)絡(luò)的內(nèi)容。
2,必須存放在一個相對干凈的主機空間,所謂干凈的主機空間就是該主機ip沒有被搜索引擎降權(quán),該ip下的其他網(wǎng)站沒有不良內(nèi)容或垃圾站,有可能的話盡量用一個獨立ip的空間,并且查一些該ip以前的使用情況。
3,必須有高質(zhì)量的外部導(dǎo)入鏈接,比如收錄良好的資訊類網(wǎng)站,發(fā)布一條公司介紹的信息,帶上公司的網(wǎng)址鏈接,如果該信息被收錄的話,那么網(wǎng)站很可能也已經(jīng)被順帶收錄了,應(yīng)該提供給了搜索引擎蜘蛛一個入口爬行到我們網(wǎng)站來
第三點尤為重要,我曾經(jīng)試過幫客戶發(fā)了一條信息,信息秒收,客戶站也被秒收。
]]>1) User-Agent鍵
后面的內(nèi)容對應(yīng)的是各個具體的搜索引擎爬行器的名稱。如百度是Baiduspider,谷歌是Googlebot。
一般我們這樣寫:
User-Agent: *
表示允許所有搜索引擎蜘蛛來爬行抓取。如果只想讓某一個搜索引擎蜘蛛來爬行,在后面列出名字即可。如果是多個,則重復(fù)寫。
注意:User-Agent:后面要有一個空格。
在robots.txt中,鍵后面加:號,后面必有一個空格,和值相區(qū)分開。
2)Disallow鍵
該鍵用來說明不允許搜索引擎蜘蛛抓取的URL路徑。
例如:Disallow: /index.php 禁止網(wǎng)站index.php文件
Allow鍵
該鍵說明允許搜索引擎蜘蛛爬行的URL路徑
例如:Allow: /index.php 允許網(wǎng)站的index.php
通配符*
代表任意多個字符
例如:Disallow: /*.jpg 網(wǎng)站所有的jpg文件被禁止了。
結(jié)束符$
表示以前面字符結(jié)束的url。
例如:Disallow: /?$ 網(wǎng)站所有以?結(jié)尾的文件被禁止。
應(yīng)該注意的是:
1,在"/robots.txt"文件中,至少要有一條Disallow記錄,允許收錄優(yōu)先級要高于禁止收錄,如
User-agent: *
Allow: /a/b.htm
Disallow: /a/
則a目錄下b.htm可以訪問,其他禁止
2,注意路徑后面加斜杠和不加斜杠的區(qū)別
如果目錄后邊帶斜杠,那么訪問不帶斜杠的地址時還是可以訪問目錄首頁,如果想屏蔽掉整個目錄,建議不帶斜杠
Allow或Disallow的值 | URL | 匹配結(jié)果 |
/tmp | /tmp | yes |
/tmp | /tmp.html | yes |
/tmp | /tmp/a.html | yes |
/tmp/ | /tmp | no |
/tmp/ | /tmphoho | no |
/tmp/ | /tmp/a.html | yes |
/Hello* | /Hello.html | yes |
/He*lo | /Hello,lolo | yes |
/Heap*lo | /Hello,lolo | no |
html$ | /tmpa.html | yes |
/a.html$ | /a.html | yes |
htm$ | /a.html | no |
3,robots文件只有放在根目錄才有效,放在子目錄沒效。
4,robots.txt文件用法舉例
例1. 禁止所有搜索引擎訪問網(wǎng)站的任何部分 | User-agent: * Disallow: / |
例2. 允許所有的robot訪問 (或者也可以建一個空文件 “/robots.txt”) |
User-agent: * Disallow: 或者 User-agent: * Allow: / |
例3. 僅禁止Baiduspider訪問您的網(wǎng)站 | User-agent: Baiduspider Disallow: / |
例4. 僅允許Baiduspider訪問您的網(wǎng)站 | User-agent: Baiduspider Disallow: User-agent: * |
例5. 禁止spider訪問特定目錄 在這個例子中,該網(wǎng)站有三個目錄對搜索引擎的訪問做了限制,即robot不會訪問這三個目錄。需要注意的是對每一個目錄必須分開聲明,而不能寫成 “Disallow: /cgi-bin/ /tmp/”。 |
User-agent: * Disallow: /cgi-bin/ Disallow: /tmp/ Disallow: /~joe/ |
例6. 允許訪問特定目錄中的部分url | User-agent: * Allow: /cgi-bin/see Allow: /tmp/hi Allow: /~joe/look Disallow: /cgi-bin/ Disallow: /tmp/ Disallow: /~joe/ |
例7. 使用”*”限制訪問url 禁止訪問/cgi-bin/目錄下的所有以”.htm”為后綴的URL(包含子目錄)。 |
User-agent: * Disallow: /cgi-bin/*.htm |
例8. 使用”$”限制訪問url 僅允許訪問以”.htm”為后綴的URL。 |
User-agent: * Allow: .htm$ Disallow: / |
例9. 禁止訪問網(wǎng)站中所有的動態(tài)頁面 | User-agent: * Disallow: /*?* |
例10. 禁止Baiduspider抓取網(wǎng)站上所有圖片 僅允許抓取網(wǎng)頁,禁止抓取任何圖片。 |
User-agent: Baiduspider Disallow: .jpg$ Disallow: .jpeg$ Disallow: .gif$ Disallow: .png$ Disallow: .bmp$ |
例11. 僅允許Baiduspider抓取網(wǎng)頁和.gif格式圖片 允許抓取網(wǎng)頁和gif格式圖片,不允許抓取其他格式圖片 |
User-agent: Baiduspider Allow: .gif$ Disallow: .jpg$ Disallow: .jpeg$ Disallow: .png$ Disallow: .bmp$ |
例12. 僅禁止Baiduspider抓取.jpg格式圖片 | User-agent: Baiduspider Disallow: .jpg$ |
]]>
網(wǎng)站上線第二天,谷歌百度的蜘蛛就造訪了,谷歌很快就收錄并放出了抓到的頁面,百度就先抓取不顯示,剛開始兩條蜘蛛都非常勤快,百度蜘蛛最多一天爬300多次,谷歌蜘蛛3000多次,現(xiàn)在每天一般是前者100次,后者2000次這樣的頻率。
谷歌收錄頁面數(shù)量一直都是穩(wěn)定地增長,到昨天達到將近6000個頁面,并且谷歌給這個博客的權(quán)重還算比較高的,關(guān)鍵詞都能獲得比較好的排名,每天都會有不少ip是通過谷歌搜索技術(shù)問題過來的,并且谷歌對新文章的反應(yīng)速度極快,基本上發(fā)一篇新博文在兩三分鐘內(nèi)會被收錄并且放出來。
百度雖然也會比較快抓取新文章,但是就是不放出,在8月10號也就是10天前放出了通過ip抓取的首頁,然后就一直沒更新快照,前天我把ip都301到域名下來,那個應(yīng)該不會再更新了。
這期間沒有去做什么外鏈,只是在博客里面對百度做了一點小小的優(yōu)化,不知道對今天的收錄有沒有一點影響。
說實話我還是比較看重網(wǎng)站在百度的表現(xiàn),谷歌退出大陸之后,在市場份額方面已經(jīng)很難跟百度抗衡了,百度現(xiàn)在擁有中國大陸絕大部分的搜索流量,對網(wǎng)站的收錄情況直接影響到網(wǎng)站的訪問量。
]]>一,安裝wp的百度地圖插件:Baidu Sitemap Generator,生成網(wǎng)站地圖
插件使用方法:
1.在 http://www.tianchuangseo.com/wp-content/uploads/2010/09/baidu-sitemap-generator.zip 下載插件,安裝并激活。
2.點擊設(shè)置里面的 Baidu-Sitemap 選項,即可看到設(shè)置界面,第一次使用你需要先激活配置。
3.然后點擊"更新 XML 文件"按鈕即可生成上述的 XML 文件和 Html 靜態(tài)頁面。
4.在你網(wǎng)站的合適位置加入這兩個鏈接即可。
二,添加robots.txt文件,文件內(nèi)容為:
User-agent: *
Disallow: /wp-
Allow: /wp-content/uploads/
Disallow: /?
Disallow: /feed
Disallow: /*/*/feed
Disallow: /trackback
Disallow: /*/*/trackback
Disallow: /index.php?
Disallow: /index.php/
Disallow: /*.php$
Disallow: /*.css$
Disallow: /date/
Sitemap: http://www.dgkai.cn/blog/sitemap_baidu.xml
Sitemap: http://www.dgkai.cn/blog/sitemap.html
三,在百度博客提交頁面提交了博客feed地址 http://ping.baidu.com/ping.html
四,設(shè)置wordrpess的自動ping服務(wù)。登陸博客后臺,選擇"設(shè)置"->"撰寫"功能模塊,在更新服務(wù)ping service那一欄填寫各個Ping中心地址保存即可。
百度博客的ping中心地址是:http://ping.baidu.com/ping/RPC2
我這邊添加的ping地址是:
http://rpc.pingomatic.com/
http://ping.baidu.com/ping/RPC2
http://blogsearch.google.com/ping/RPC2
http://api.my.yahoo.com/RPC2
http://api.my.yahoo.com/rss/ping
http://ping.feedburner.com
http://www.zhuaxia.com/rpc/server.php
http://www.xianguo.com/xmlrpc/ping.php
http://www.feedsky.com/api/RPC2
http://blog.iask.com/RPC2
http://ping.blog.qikoo.com/rpc2.php
http://rpc.technorati.com/rpc/ping
http://www.blogsdominicanos.com/ping/
]]>下面是一些搜索引擎提供的博客搜索服務(wù):
http://blogsearch.google.com/ 谷歌博客搜索
http://blogsearch.baidu.com/ 百度博客搜索
http://blog.soso.com/ 騰訊搜搜博客搜索:可以搜QQ空間
http://blog.youdao.com/ 網(wǎng)易有道博客搜索:有一些有趣的數(shù)據(jù)整理方式
下面則是這些搜索引擎相應(yīng)提供的提交博客入口:
http://blogsearch.google.com/ping?hl=zh-CN google博客提交入口
http://utility.baidu.com/blogsearch/submit.php 百度博客提交入口,有驗證碼
http://tellbot.youdao.com/report?type=BLOG 有道博客提交入口,有驗證碼
http://blog.soso.com/join.html 騰訊搜搜博客搜索提交入口
博客ping服務(wù)地址:
ping是基于XML_RPC標(biāo)準(zhǔn)協(xié)議的更新通告服務(wù),是用于blog在內(nèi)容更新時通知博客搜索引擎及時進行抓取、更新的方式。博客搜索引擎在成功接受到ping以后,會立刻進行抓取并更新。使用ping服務(wù),可以讓博客搜索引擎在第一時間抓取到您博客上的新內(nèi)容。
http://blogsearch.google.com/ping/rpc2 谷歌博客搜索ping服務(wù)
http://ping.baidu.com/cgi-bin/blog 百度博客搜索ping服務(wù)
http://blog.youdao.com/ping/RPC2 網(wǎng)易有道博客搜索ping服務(wù)
下面的代碼是天涯博客實現(xiàn)博客的博文自動提交,其他網(wǎng)站頁面的提交道理也是相同的,都是利用博客的自動ping服務(wù):
<form id=frm_google_ping name=frm_google_ping action=http://blogsearch.google.com/ping method=get target="iframe__google_ping">
<input type="hidden" name="name" value="tianyablog" ID="Hidden4">
<input type="hidden" name="url" value="http://www.dgkai.cn/" ID="Hidden5">
<input type="hidden" name="changesURL" value="http://www.dgkai.cn/blog/about" ID="Hidden6">
</form>
<iframe name="iframe__google_ping" src="" width="0" height="0"></iframe>
<br><br>
<form id=frm_soso_ping name=frm_soso_ping action="http://tep.soso.com/cgi-bin/pingd.fcgi" method=get target="iframe_soso_ping">
<input type="hidden" name="soso_url" value="tianyablog" ID="sosoHidden4">
<input type="hidden" name="soso_url" value="http://www.dgkai.cn/ " ID="sosoHidden5">
<input type="hidden" name="soso_url" value="http://www.dgkai.cn/" ID="sosoHidden6">
</form>
<iframe name="iframe_soso_ping" src="" width="0" height="0"></iframe>
]]>