減少網(wǎng)站的重復(fù)內(nèi)容,提高網(wǎng)站的整體質(zhì)量。(
滄州網(wǎng)站仿站)
為什么會產(chǎn)生重復(fù)內(nèi)容
重復(fù)內(nèi)容是指不同的URL鏈接內(nèi)容卻是相同的,造成重復(fù)內(nèi)容的原因可能是內(nèi)容的采集,直接使用采集工具采集其他站點內(nèi)容;網(wǎng)站因為網(wǎng)址不規(guī)范,導(dǎo)致網(wǎng)站有多個URL地址可以訪問,蜘蛛也同時收錄多個重復(fù)頁面;網(wǎng)站沒有設(shè)置404錯誤頁面,默認所有的錯誤鏈接跳轉(zhuǎn)到首頁,這樣處理錯誤鏈接的方法也導(dǎo)致網(wǎng)站大量重復(fù)頁面;或者因為像商城類的網(wǎng)站,因為產(chǎn)品大小不同,設(shè)置多個頁面進行介紹,但是網(wǎng)頁的大體內(nèi)容是相同的,這樣的情況也會被蜘蛛認為是重復(fù)的內(nèi)容。
重復(fù)內(nèi)容如何檢測
如果自己站點內(nèi)部存在重復(fù)內(nèi)容,要檢測還是比較容易site:域名,看下搜素引擎是否收錄了重復(fù)的內(nèi)容。但是要是檢測外部頁面是否重復(fù),可以拿頁面中的一句話,加上雙引號后去搜索引擎查找,如果網(wǎng)絡(luò)中存在大量的相同句子,點擊查看并可知道是否是整篇網(wǎng)頁是否重復(fù)。往往這樣的檢測方法比較難,能找出一句話出現(xiàn)在另一篇文章中的可能性低。對于檢測一篇文章是否被剽竊,title:+文章標題并可找出相同的文章。、
重復(fù)內(nèi)容是否有危害
網(wǎng)站大量存在采集的重復(fù)內(nèi)容,搜索引擎會認為這樣的站點是垃圾站點,會很快遭到搜索引擎的降權(quán)處理,往往搜索引擎會降權(quán)哪些大量存在重復(fù)內(nèi)容的站點,少量存在復(fù)制內(nèi)容的站點,蜘蛛不會給予降權(quán),蜘蛛會判斷重復(fù)的頁面中,哪些頁面是原創(chuàng)頁面,對給予這樣的重復(fù)頁面進行排名,搜索引擎有時會存在錯誤的判斷,就會導(dǎo)致站長們經(jīng)常看到的現(xiàn)象,自己原創(chuàng)的內(nèi)容被其他站點轉(zhuǎn)載,其他站點收錄排名很好,但是自己站點卻并沒有被收錄。
在自己網(wǎng)站中存在重復(fù)頁面,蜘蛛收錄的頁面鏈接跟推廣的鏈接不統(tǒng)一,并導(dǎo)致網(wǎng)站權(quán)重的丟失,特別是網(wǎng)站中一些重要的頁面,如果存在多個URL鏈接,對用戶來說不容易記憶,對蜘蛛來說也是作弊的優(yōu)化手段,大量存在重復(fù)復(fù)制內(nèi)容的站點,搜索引擎會產(chǎn)生作弊優(yōu)化的猜疑,給予降權(quán)處理。
如何消除重復(fù)內(nèi)容
站內(nèi)的重復(fù)內(nèi)容往往來源于網(wǎng)址不規(guī)范,對于網(wǎng)址不規(guī)范的問題,最好的解決方法就是301轉(zhuǎn)向,把網(wǎng)站所有的內(nèi)部鏈接,規(guī)范到統(tǒng)一的URL鏈接上,減少網(wǎng)站權(quán)重的流失。對于是因為版本的不同導(dǎo)致的重復(fù)內(nèi)容,可以使用robots文件屏蔽,禁止蜘蛛抓取不必要的頁面,或者不希望收錄的鏈接可以用nofollow標簽。
前面說到的商城網(wǎng)站因為產(chǎn)品的大小不同,導(dǎo)致的重復(fù)頁面收錄,可以使用canonical標簽,百度支持Canonical標簽以后,站長可以通過將 元素和rel="canonical" 屬性添加到該網(wǎng)頁非規(guī)范版本的 部分,為搜索引擎指定規(guī)范網(wǎng)頁。