我們在網(wǎng)站運營過程中也有所體會,把握不少細節(jié)就能夠總結許多經(jīng)驗,在這里就談談小編這幾年的豐富經(jīng)驗,當然也有很多不足之處,望同仁們指出,促使自己更加不斷的成長,以下是個人見解,還望相互交流學習,共同進步。
搜索引擎判斷原創(chuàng)的標準:
1、服務器時間或蜘蛛爬行抓取時間
內(nèi)容是否原創(chuàng)判斷的重要依據(jù)之一便是更新的時間先后,因此搜索引擎為根據(jù)內(nèi)容更新時間去深入判斷,也就是通過掌握服務器時間來把握,當然更應該結合各大蜘蛛對URL的爬行抓取時間做出更為精確的判斷,當然由于蜘蛛爬行抓取是機器語言,相比大腦而言,還是不夠機靈的,因此也存在原創(chuàng)內(nèi)容判斷失誤的情況,當然為了彌補和改善這一情況,各大搜索引擎也推出相應的解決工具,比如:百度搜素引擎中的ping服務能夠讓搜索搜索引擎第一時間掌握內(nèi)容更新時間。
2、搜索引擎切詞檢索
目前各大搜索引擎在判斷內(nèi)容是否原創(chuàng)時,最為重要的依據(jù)還必須是進行切詞進行檢索,通過數(shù)據(jù)庫進行信息對比,是否存在重復性,通過此類方面對原創(chuàng)內(nèi)容的判斷相比而言較為準確,當然至于切詞進行檢索,有可能是某一句,某一段或者更多,相信隨機性的可能性比較大,至于具體的情況需要深入了解搜索引擎機制了。原創(chuàng)內(nèi)容的重要性很大,直接影響到網(wǎng)站的權重,故原創(chuàng)內(nèi)容重點應該把握搜索引擎機制,當然用戶才是第一位,兩者也可兼得。
3、百度原創(chuàng)識別“起源”算法
針對原創(chuàng)識別的問題,各大搜索引擎也在逐漸發(fā)力,比如:百度原創(chuàng)識別“起源”算法,首先主要是通過內(nèi)容相識度來進行聚合存檔建立數(shù)據(jù)庫,其次進一步結合網(wǎng)站自身原創(chuàng)情況、作者口碑、發(fā)布時間、鏈接指向、用戶評論、轉發(fā)軌跡等多種因素進行判斷,最后通過價值分析最終進行排序展示給搜索用戶。當然由于諸多因素共同作用,同樣也存在許多失誤,只能說解決大部分所需,“起源”算法還在不斷完善中。
4、百度原創(chuàng)星火計劃
搜索引擎為了滿足更多用戶的需求,提供高質(zhì)量信任的內(nèi)容,逐漸推出一系列相應措施,目前百度原創(chuàng)星火計劃的實行和推廣,也取得了初步的效果,一期對部分重點原創(chuàng)新聞站點的原創(chuàng)內(nèi)容在百度搜索結果中給予了原創(chuàng)標記、作者展示等等,以此獲得更好的展現(xiàn),滿足用戶提高眼,并且站點在排序及流量上也取得了合理的提升。
目前原創(chuàng)星火計劃已經(jīng)開始步入第二期,也提倡高質(zhì)量原創(chuàng)站點主動進行申請,獲得原創(chuàng)星火計劃資格,內(nèi)容得到百度搜索引擎的推薦以及更好的展現(xiàn)。