技術(shù)資訊
什么是網(wǎng)站被鏡像了?
2019-08-01 12:30:52
涉及到網(wǎng)站設(shè)計(jì)就不得不提一下網(wǎng)站惡意鏡像了。鏡像我們的網(wǎng)站就像是一面鏡子一樣,自己的網(wǎng)站有什么東西,對(duì)方網(wǎng)站就會(huì)同步出現(xiàn)什么東西,比如你自己網(wǎng)站新增了一篇新聞后,只要有人訪問(wèn)了該篇新聞,那么鏡像你的網(wǎng)站也會(huì)同步更新上去了該篇新聞,這采集網(wǎng)站還不太一樣,是不是很討厭吧。
什么是惡意鏡像的網(wǎng)站?
鏡像網(wǎng)站指的是和你的網(wǎng)站基本一樣、并且實(shí)時(shí)同步的其它網(wǎng)站。就像照鏡子一樣,所以名為鏡像。
有的鏡像網(wǎng)站是沒(méi)有惡意的,很可能是你自己設(shè)置的,為了方便用戶(hù)能從多個(gè)域名訪問(wèn)網(wǎng)站,被封了一個(gè),還有其它的域名。比如著名的草榴社區(qū),好像就有很多鏡像可以訪問(wèn)。
有的鏡像,也就是這里討論的鏡像,是不懷好意的,通常是別人設(shè)置的,要么為了負(fù)面SEO你的網(wǎng)站,要么為了利用你的內(nèi)容獲得排名,然后把用戶(hù)轉(zhuǎn)向到敏感、非法內(nèi)容網(wǎng)站上去。
網(wǎng)上有的文章把采集和鏡像混在一起。雖然表現(xiàn)形式差不多,但嚴(yán)格來(lái)說(shuō),采集和鏡像實(shí)現(xiàn)方法、表現(xiàn)形式是有區(qū)別的。
采集的網(wǎng)站一般是提前抓取別人網(wǎng)站的內(nèi)容,放入自己數(shù)據(jù)庫(kù),再用程序調(diào)用到頁(yè)面上。被采集網(wǎng)站有新內(nèi)容時(shí),采集網(wǎng)站并不能實(shí)時(shí)同步更新,要再采集之后才能出現(xiàn)。一旦被采集,內(nèi)容已經(jīng)在對(duì)方數(shù)據(jù)庫(kù)里了,從技術(shù)上是無(wú)法阻止采集網(wǎng)站顯示這些內(nèi)容的。這篇帖子說(shuō)的不是這種。
鏡像網(wǎng)站并不事先抓取內(nèi)容,而是有人訪問(wèn)網(wǎng)站時(shí),實(shí)時(shí)從被鏡像的網(wǎng)站調(diào)取內(nèi)容,做些處理(替換URL、文字,加文字、加JS等),然后實(shí)時(shí)顯示。被鏡像的網(wǎng)站有任何更新,鏡像網(wǎng)站是實(shí)時(shí)同步的。
網(wǎng)上有賣(mài)用于鏡像網(wǎng)站的小偷程序的。小偷程序通常也可以用來(lái)做采集。為了不給他們做宣傳,就不提名字了。從他們的官網(wǎng)摘取幾條程序功能,有助于理解后面的內(nèi)容:
全自動(dòng)分析,內(nèi)外鏈接自動(dòng)轉(zhuǎn)換、圖片地址、css、js,自動(dòng)分析CSS內(nèi)的圖片
內(nèi)置強(qiáng)大替換和過(guò)濾功能,標(biāo)簽過(guò)濾、站內(nèi)外過(guò)濾、字符串替換、等等
偽原創(chuàng),近義詞替換有利于seo(什么是網(wǎng)站SEO)
增加URL路由,實(shí)現(xiàn)全站URL變換,個(gè)性化本站URL地址
超級(jí)模板增加移動(dòng)模板、自定義欄目功能
增加自動(dòng)獲取301、302重定向的采集,解決跳WWW,跳https采集
代理IP、偽造IP、隨機(jī)IP、偽造user-agent、偽造referer來(lái)路、自定義cookie,以便應(yīng)對(duì)防采集措施
其實(shí)我是挺迷惑,網(wǎng)信辦為什么不責(zé)令關(guān)閉賣(mài)小偷程序的網(wǎng)站,這種網(wǎng)站才是真正該關(guān)的,而不是另外一些網(wǎng)站。
被鏡像有什么危險(xiǎn)
從SEO角度看,權(quán)重不高的小站、新站,被鏡像意味著有其它網(wǎng)站和你的網(wǎng)站內(nèi)容基本一樣,搜索引擎有可能認(rèn)為你的網(wǎng)站不是原版,鏡像網(wǎng)站才是,所以把排名、流量給了鏡像網(wǎng)站。
對(duì)有一定歷史、權(quán)重的網(wǎng)站,鏡像網(wǎng)站取代原版網(wǎng)站的可能性微乎其微。但從心情角度考慮,被別人鏡像,內(nèi)容被別人偷走,即使沒(méi)有其它明顯后果,也還是挺煩人的一件事。
另一個(gè)煩人的事是,鏡像網(wǎng)站一般來(lái)說(shuō)并不是要和你提供同樣的產(chǎn)品或服務(wù),而是把用戶(hù)轉(zhuǎn)到賭博、色情等服務(wù)上去。有的是通過(guò)JS把賭博、色情內(nèi)容顯示給用戶(hù),有的直接把用戶(hù)轉(zhuǎn)向到另外的網(wǎng)站上去。
怎樣發(fā)現(xiàn)自己網(wǎng)站被鏡像了
有時(shí)候注意到被鏡像了是因?yàn)樽约壕W(wǎng)站排名下降,懷疑有人負(fù)面SEO。有時(shí)候是搜索品牌名稱(chēng),看到鏡像網(wǎng)站。已經(jīng)知道自己被鏡像了好辦,直接看下面怎么處理部分。
很多站長(zhǎng)則完全不知道自己網(wǎng)站是否被鏡像了。有幾個(gè)我常用的檢查方法。
一是百度統(tǒng)計(jì)后臺(tái):
受訪域名部分列出了使用相同百度統(tǒng)計(jì)代碼的域名。其中出現(xiàn)快照、百度/谷歌翻譯等是正常的,但出現(xiàn)一些奇奇怪怪的域名就要查看一下了,比如上圖里的第5、7、8個(gè),訪問(wèn)一下就知道都是鏡像SEO每天一帖,引誘用戶(hù)賭博的網(wǎng)站,然后站長(zhǎng)把SEO每天一帖的統(tǒng)計(jì)代碼也照抄過(guò)去了。
看看上面列出的小偷出現(xiàn)功能就知道,其實(shí)統(tǒng)計(jì)代碼很容易替換或刪除的。所以在受訪域名只能看到一小部分鏡像網(wǎng)站。
第二是搜索網(wǎng)站的特征句子。最容易想到的是網(wǎng)站品牌名稱(chēng)、首頁(yè)標(biāo)題等,確實(shí)可以發(fā)現(xiàn)一些鏡像網(wǎng)站。但如前所述,品牌名絕大多數(shù)是會(huì)被替換的,所以我更喜歡搜索一些頁(yè)面上的特征句子,比如本博客最上面的副標(biāo)題:Zac的SEO博客,堅(jiān)持12年,優(yōu)化成為生活。搜索一下就會(huì)看到:
看來(lái)我的博客很容易吸引菠菜啊。
一般我不搜索帖子里的句子,因?yàn)槟菚?huì)返回大量轉(zhuǎn)載、抄襲的頁(yè)面,不是鏡像的。
從上圖可以看到,鏡像網(wǎng)站自動(dòng)把title及正文中的品牌詞或指定關(guān)鍵詞替換了,訪問(wèn)這類(lèi)網(wǎng)站效果常常是這樣的:
上圖鏡像網(wǎng)站沒(méi)有轉(zhuǎn)向,也沒(méi)有用JS顯示大量菠菜內(nèi)容,而是直接在正文中插入菠菜內(nèi)容和鏈接。有的鏡像網(wǎng)站用JS在頁(yè)面上半部分顯示大量?jī)?nèi)容,就像在典型賭博網(wǎng)站看到的一樣,拉到下面才能看到鏡像的內(nèi)容。
為了搜得更全,還經(jīng)常需要多搜索其它地方的特征文字。比如搜索頁(yè)腳的聲明中的一句:“明明很久一貼,為什么號(hào)稱(chēng)“看到另一些鏡像網(wǎng)站:
為什么搜索句子的一半,不是搜索“明明很久一貼,為什么號(hào)稱(chēng)SEO每天一帖“呢?還是因?yàn)槠放圃~或特征關(guān)鍵詞經(jīng)常是會(huì)被替換的,比如這樣:
一般我是用Google做這種搜索,因?yàn)镚oogle什么亂七八糟的都收錄。
網(wǎng)站被鏡像了怎么辦?
首先,一些網(wǎng)上提到的解決辦法并沒(méi)有什么用。
比如有的說(shuō)頁(yè)面上的鏈接用絕對(duì)地址有幫助,其實(shí)小偷程序都會(huì)自動(dòng)替換網(wǎng)址,用相對(duì)地址還是絕對(duì)地址沒(méi)什么差別。
還有的說(shuō)頁(yè)面上加上網(wǎng)站鏈接、網(wǎng)站名稱(chēng)、版權(quán)聲明之類(lèi)的,搜索引擎會(huì)識(shí)別哪個(gè)是正版。但鏡像小偷程序連鏈接帶文字都可以全部自動(dòng)替換,這么做并沒(méi)有用。
發(fā)現(xiàn)鏡像網(wǎng)站后的處理原則就是讓鏡像網(wǎng)站不能在鏡像域名上顯示你的內(nèi)容??紤]到鏡像網(wǎng)站是要實(shí)時(shí)訪問(wèn)和調(diào)用被鏡像的頁(yè)面的,所以可以考慮幾個(gè)方法。
比如用JS檢測(cè)一下正在被打開(kāi)的頁(yè)面是不是在自己的域名上,是的話正常顯示,不是的話(域名是鏡像網(wǎng)站時(shí))強(qiáng)迫轉(zhuǎn)向到自己域名:
if (window.location.hostname !== ‘www.ihaomai.cn’){
window.top.location.href = ‘http://www.ihaomai.cn/’;
}
(聲明:我對(duì)程序不熟,代碼只是簡(jiǎn)單舉例,具體怎么寫(xiě),請(qǐng)問(wèn)你的程序員。)
不過(guò)這種方法只對(duì)用戶(hù)有效,搜索引擎不執(zhí)行JS,還是會(huì)抓取到鏡像內(nèi)容。也可以用PHP寫(xiě)腳本判斷和轉(zhuǎn)向。
有時(shí)候由于種種原因,程序不起作用。另一個(gè)直接的方法是屏蔽鏡像網(wǎng)站來(lái)訪問(wèn)的IP地址。先查一下鏡像網(wǎng)站服務(wù)器IP:
把對(duì)方主機(jī)IP先屏蔽了。不過(guò)鏡像網(wǎng)站來(lái)實(shí)時(shí)抓取用的IP大部分情況下不是域名主機(jī)IP,可能是CDN,可能是偽造IP,也可能是多IP的服務(wù)器。要發(fā)現(xiàn)必須屏蔽的IP,需要查看網(wǎng)站原始日志(如何查看網(wǎng)站訪問(wèn)日志)。我的一個(gè)小竅門(mén)是,訪問(wèn)鏡像網(wǎng)站上一個(gè)很少人會(huì)訪問(wèn)的頁(yè)面,比如翻頁(yè)第70頁(yè),然后馬上查看日志,這個(gè)頁(yè)面被訪問(wèn)的IP就是應(yīng)該屏蔽的IP:
屏蔽了這個(gè)IP,再訪問(wèn)鏡像網(wǎng)站就變成403錯(cuò)誤了(什么是403錯(cuò)誤頁(yè)面):
不知道頁(yè)腳的友情鏈接是鏡像網(wǎng)站自己加的?還是賣(mài)程序的人強(qiáng)制加的?
鏡像網(wǎng)站經(jīng)常是會(huì)偽造或?qū)崟r(shí)輪換IP地址的,如果屏蔽一個(gè)IP網(wǎng)站還能訪問(wèn),就再訪問(wèn)翻頁(yè)69頁(yè)、68頁(yè)等等,找到更多IP。屏蔽也可以屏蔽IP段。我的經(jīng)驗(yàn)是,通常鏡像網(wǎng)站不會(huì)使用超過(guò)10個(gè)IP地址。
當(dāng)然也可以寫(xiě)個(gè)簡(jiǎn)單的腳本放自己網(wǎng)站上,比如www.ihaomai.cn/mirror.php:
<?php
echo $_SERVER[‘REMOTE_ADDR’];
?>
腳本唯一功能就是顯示訪問(wèn)的IP,然后自己訪問(wèn)一下小偷鏡像網(wǎng)站的腳本網(wǎng)址,也就是www_bloody-thief_com/mirror.php,頁(yè)面上就直接顯示鏡像網(wǎng)站訪問(wèn)你服務(wù)器時(shí)的IP了。如果鏡像網(wǎng)站替換了URL,這個(gè)方法就不好用了。無(wú)論怎樣,日志中是一定有的。
另外,發(fā)現(xiàn)鏡像網(wǎng)站,可以向百度、域名注冊(cè)商、主機(jī)服務(wù)商投訴,要求關(guān)閉網(wǎng)站或刪除頁(yè)面。投訴是否管用就是另一回事了,還是先做好IP屏蔽和URL檢測(cè)。
近期更新
- [2023-07-26 14:17:28] 為品牌賦能,海外官網(wǎng)品牌數(shù)字化
- [2023-05-06 10:32:26] 青島網(wǎng)站建設(shè)公司,高端網(wǎng)站定制,一站式網(wǎng)站服務(wù)——力圖數(shù)字科技
- [2023-04-27 13:47:54] 高端定制網(wǎng)站建設(shè)——從滿(mǎn)足預(yù)期到走向卓越
- [2023-04-11 09:17:49] H5頁(yè)面設(shè)計(jì)開(kāi)發(fā)——移動(dòng)端傳播利器
- [2022-11-16 10:11:43] windows2012程序在哪
- [2022-04-14 11:01:47] 力圖數(shù)字科技配套網(wǎng)站服務(wù)支持
- [2021-05-18 10:14:11] 青島網(wǎng)站建設(shè)的流程
- [2021-04-29 10:14:38] 企業(yè)定制化官網(wǎng)建設(shè)項(xiàng)目
- [2021-03-05 10:34:45] 移動(dòng)互聯(lián)時(shí)代房地產(chǎn)行業(yè)的微信小程序解決方案
- [2021-01-22 17:29:38] 微信小程序有哪些優(yōu)勢(shì)?為什么要開(kāi)發(fā)微信小程序?
- [2021-01-08 17:28:04] 網(wǎng)站建設(shè)最容易忽略的人性化設(shè)計(jì)
- [2020-12-16 16:55:32] 建設(shè)一個(gè)常規(guī)的公司網(wǎng)站建設(shè)成本大概是多少?
延伸閱讀
- [2012-05-31 22:32:04] DEDE圖集自動(dòng)生成大小圖
- [2011-11-07 11:47:33] 百度網(wǎng)站地圖提交入口
- [2011-12-09 23:13:52] 網(wǎng)站點(diǎn)擊量與排名的關(guān)系
- [2011-11-04 15:14:32] 網(wǎng)站被K后怎么辦 以及應(yīng)對(duì)經(jīng)驗(yàn)總結(jié)
- [2012-11-20 16:50:46] dede 采集 圖片不全
- [2014-01-03 10:08:13] 青島網(wǎng)站建設(shè)布局對(duì)網(wǎng)站優(yōu)化的影響與分析
- [2011-11-13 11:03:19] 如何讓搜索引擎收錄更多的內(nèi)容頁(yè)
- [2011-11-05 23:02:49] 讓網(wǎng)站外鏈在你睡著的時(shí)候也能自動(dòng)增加的方法
- [2012-05-15 19:29:01] 彈出窗口代碼
- [2011-11-07 11:49:28] google網(wǎng)站地圖提交入口
- [2011-11-07 11:52:15] ASK網(wǎng)站地圖提交入口
- [2014-07-08 00:55:05] 修改網(wǎng)站標(biāo)題對(duì)百度排名的影響
解決方案
輪胎行業(yè)網(wǎng)站設(shè)計(jì)解決方案 機(jī)械行業(yè)網(wǎng)站設(shè)計(jì)解決方案 房地產(chǎn)行業(yè)網(wǎng)站設(shè)計(jì)解決方案 科技企業(yè)網(wǎng)站設(shè)計(jì)解決方案 電子家電網(wǎng)站設(shè)計(jì)解決方案 食品行業(yè)網(wǎng)站設(shè)計(jì)解決方案 集團(tuán)公司網(wǎng)站設(shè)計(jì)解決方案 企事業(yè)單位網(wǎng)站設(shè)計(jì)解決方案 外貿(mào)行業(yè)網(wǎng)站設(shè)計(jì)解決方案 健身運(yùn)動(dòng)網(wǎng)站設(shè)計(jì)解決方案 美容與化妝品網(wǎng)站設(shè)計(jì)解決方案 建筑設(shè)計(jì)行業(yè)網(wǎng)站設(shè)計(jì)解決方案 物流行業(yè)網(wǎng)站設(shè)計(jì)解決方案
TAGS關(guān)鍵字
高端網(wǎng)站設(shè)計(jì) 企業(yè)建站 青島不錯(cuò)的英文網(wǎng)站建設(shè)公司 空白和簡(jiǎn)潔的設(shè)計(jì) 集團(tuán)官網(wǎng) 企業(yè)網(wǎng)站設(shè)計(jì) 青島網(wǎng)站制作 網(wǎng)站改版 視覺(jué)靈感 舒適的界面 青島網(wǎng)站設(shè)計(jì)哪家好 微官網(wǎng) 青島網(wǎng)站SEO 海信網(wǎng)絡(luò)科技 SEO優(yōu)化 微信營(yíng)銷(xiāo)的優(yōu)勢(shì) 營(yíng)銷(xiāo)型網(wǎng)站建設(shè) 圖形網(wǎng)格 網(wǎng)站SEO 集團(tuán)性網(wǎng)站 網(wǎng)站建設(shè)的步驟有哪些 H5專(zhuān)題頁(yè)面 青島黃島、紅島網(wǎng)站建設(shè)公司 網(wǎng)站制作 網(wǎng)站設(shè)計(jì)趨勢(shì) 青島網(wǎng)站營(yíng)銷(xiāo) 平面設(shè)計(jì) 青島輪胎網(wǎng)站設(shè)計(jì) 搜索引擎 審美