微軟的搜索引擎核心技術(shù)不咋樣,但品牌卻是換了又換,從MSN到Live,再到胎死beta的Kumo,到現(xiàn)在的Bing。
國內(nèi)是不能直接訪問Bing的,有興趣的同學請想辦法解決。
本文主要是分析一下Bing Webmater Tools的各個功能,以供參考。
一、驗證過程
要使用Bing網(wǎng)站管理員工具,首先需要驗證你擁有網(wǎng)站管理權(quán)限。
有兩個驗證方法,按照Bing要求在網(wǎng)站根目錄放一個xml文件或者在首頁Head部分添加一個meta。如下圖:
二、概覽Summary
驗證之后進入網(wǎng)站概覽,里面包括了Bing對網(wǎng)站索引的基本信息。
- last crawled:MSNbot對網(wǎng)站最近一次抓取的大概時間,誤差在幾天范圍。
- Domain score:域名得分,Bing對網(wǎng)站的信任程度,分為五級,五個綠框是最高,五個白框是最低。
- Indexed pages:被Bing收錄的網(wǎng)頁數(shù)目,是一個大概數(shù)目,所以每次刷新數(shù)值都有可能不一樣。
- Blocked:如果顯示為Yes,說明網(wǎng)站被Bing懲罰了。按照Bing的官方指南,我們先去Bing搜索一下site:domain.com,看看網(wǎng)站是否被Bing索引。如果證明被懲罰,可以去提交Bing網(wǎng)站重新收錄表單,在下拉框中選擇Content Inclusion Request。詳細指南請參考這里。
- Top 5 pages:列出Bing認為最重要的五個頁面,每個頁面有頁面得分、語言、區(qū)域,最后一次抓取大概日期,是否blocked等細節(jié)。如果你看到頁面語言、區(qū)域顯示的是 zz 或 ??,說明Bing并不能識別你網(wǎng)站的語言、區(qū)域。如果頁面blocked顯示Yes,說明你的網(wǎng)頁有問題,先去Bing搜索url:domain.com/webpage,看看是否被索引。
三、切換到profile標簽
網(wǎng)站xml地圖提交;聯(lián)系郵箱更改。提示說會定期發(fā)一些更新信息郵件,但我從來沒有收到過。
四、抓取問題Crawl Issues
通過這個工具,你可以發(fā)現(xiàn)Bing在抓取、收錄網(wǎng)站時候出現(xiàn)的各種問題。包括:
- 丟失、錯誤的鏈接
- 被Robots.txt禁止的鏈接
- 太長以致于影響蜘蛛進行正常抓取及收錄的URL
- 被標記有惡意代碼的網(wǎng)頁
- Bing不支持的網(wǎng)頁內(nèi)容
功能顯然不是很完善,雖然看起來很強大,但發(fā)現(xiàn)不了多少問題。
五、站外鏈接backlinks
通過這個工具可以查看Bing收錄鏈向自己網(wǎng)站的所有鏈接,默認包括了本站。如果需要查看所有外部鏈接,只需選上“Filter backlinks by top-level domain, subdomain or subfolder”,輸入網(wǎng)站域名,并選“Exclude all results with this URL”,然后Search即可。數(shù)量比Yahoo site explorer、Google Webmaster Tools少很多,充分說明Bing收錄網(wǎng)頁數(shù)量比不上前二者。
你可以看到這些鏈接的標題,鏈接所在的頁面URL,頁面的得分、語言、區(qū)域。同時支持以CSV格式導出所有鏈接數(shù)據(jù),如下圖:
六、出站鏈接outbound links
列出所有指向站外的鏈接。
你可以查看鏈接到頁面的標題、URL、得分、語言、區(qū)域。由于界面和backlinks一樣,偷點懶,不截圖了。
七、關鍵詞keywords
使用這個工具,得到網(wǎng)頁對于某個關鍵詞的得分。得分越高的越靠前,最靠前說明該網(wǎng)頁在Bing中獲得排名的可能性最大。
可以在一定程度上檢驗關鍵詞分配是否成功,比較實用。
八、網(wǎng)站地圖sitemaps
當你想提交網(wǎng)站地圖或者網(wǎng)站地圖有更新的時候,有兩種方法通知Bing:
- http://www.bing.com/webmaster/ping.aspx?siteMap=[your sitemap web address],直接訪問這個網(wǎng)址即可。
- 在本工具下直接提交。見圖:
以上即為目前Bing Webmaster Tools提供的網(wǎng)站工具。
Bing還提供了三個通用工具,在這里也介紹一下。
九、Robots.txt驗證工具
Robots.txt驗證工具,檢查代碼有沒有錯誤。
請點擊這里使用該工具。
將Google的Robots.txt內(nèi)容拷貝進去驗證,結(jié)果如下:
十、HTTP壓縮、Conditional Get測試
網(wǎng)站為了節(jié)省流量,通常會對網(wǎng)頁進行壓縮,該工具測試網(wǎng)頁是否經(jīng)過壓縮。
Conditional Get也是網(wǎng)站節(jié)省流量的一種方法,通過HTTP中的If-Modified-Since控制,該工具亦可進行測試。
直接訪問該工具請點這里。
總的說來,Bing網(wǎng)站管理員工具功能都挺實用的,但就是總讓人感覺數(shù)據(jù)不夠精確。這和微軟的搜索核心技術(shù)有關。
對于微軟我是恨鐵不成鋼啊,本來還希望他收購Yahoo的搜索業(yè)務,增強自己的技術(shù)及市場份額,也許能從Google嘴里搶點湯喝。
現(xiàn)在這個希望基本破滅了。
Google一家獨大,聽說都要繼微軟、英特爾之后成為歐盟的第三個提款機了,嘿嘿。