法夏:新聞里那些“死掉”的超鏈接,是如何被灰產(chǎn)給占用|全媒派

在網(wǎng)頁新聞中,超鏈接時常作為一種補(bǔ)充資料出現(xiàn),用戶能夠點(diǎn)擊超鏈接閱讀媒體所引用的資料原文。

但隨著信息數(shù)據(jù)的不斷堆積,網(wǎng)絡(luò)上的許多超鏈接其實(shí)已經(jīng)失效了,比如有時候點(diǎn)擊一個十幾年前的文章鏈接,會反饋一個類似于“頁面已消失”的提示。

大部分用戶并不會特別關(guān)注一個超鏈接是否還有效,但在網(wǎng)絡(luò)上,有一些人卻像盜墓者一般搜尋著這些沉睡已久的超鏈接并用其牟利。

超鏈接怎么了?誰在利用那些已經(jīng)“死去”的超鏈接?

本文將聚焦于那些已經(jīng)無效的超鏈接,匯編并分析國外媒體所經(jīng)歷的無效超鏈接被篡改的困擾,試圖揭示當(dāng)下新聞歸檔存在的問題以及無效超鏈接背后巨大的灰色利益。

超鏈接之“死”

根據(jù)哈佛大學(xué)法學(xué)院一個團(tuán)隊(duì)對于《紐約時報》的調(diào)查,他們發(fā)現(xiàn)在該報553,693篇文章中的一百七十多萬個深度鏈接(Deeplink)已經(jīng)有25%完全無法使用。當(dāng)用戶點(diǎn)擊這些深度鏈接,曾經(jīng)的頁面已經(jīng)變成一片空白。[1]

這樣的情形被稱為鏈接無效(linkrot),頁面會出現(xiàn)“404”的提示。

深度鏈接是指能夠?qū)蛲獠烤W(wǎng)站頁面的渠道,使用者能夠通過該鏈接進(jìn)入某個特定的外部頁面。如果沒有采用深度鏈接技術(shù),則使用者需要自行搜尋相關(guān)的內(nèi)容。深度鏈接大大縮短了用戶的使用路徑,在圖文內(nèi)容消費(fèi)場景里,基本上可以將深度鏈接理解為我們更為熟悉的超鏈接。

而超鏈接變無效鏈接,主要原因則是原有內(nèi)容消失、變更或者位置改變,這使得服務(wù)器無法返回有效的頁面。

如《好萊塢報道》曾為前華特·迪士尼CEO羅伊·迪士尼的妻子發(fā)表一篇訃告,并附上了一個紀(jì)念網(wǎng)站的鏈接,讀者可以在該網(wǎng)站中向慈善機(jī)構(gòu)捐款以紀(jì)念逝者。之后,其家人關(guān)閉了該網(wǎng)站。盡管網(wǎng)站不復(fù)存在,但《好萊塢報道》所引用的超鏈接依然能夠跳轉(zhuǎn),這樣的超鏈接就成了無效鏈接。

法夏:新聞里那些“死掉”的超鏈接,是如何被灰產(chǎn)給占用|全媒派
微信公眾號中的超鏈接呈現(xiàn)形式

無效的情況會隨著超鏈接年份的累積變得更為普遍,因?yàn)殡S著時間的流逝,當(dāng)初所引用的大量網(wǎng)站都可能已經(jīng)不再被使用。

在對《紐約時報》的這項(xiàng)調(diào)查結(jié)果顯示,發(fā)表于2018年的文章有6%的超鏈接已經(jīng)無效;而2008年的文章則有43%的無效超鏈接;到了1998年,這一指標(biāo)竟達(dá)到72%之高。在整體上,53%的文章中至少存在一個無效的超鏈接,也就是兩篇文章中至少有一篇文章有一個無效的鏈接。

超鏈接的失效也與文章類型有關(guān),不同板塊的文章在無效鏈接的比例上也存在差異。

例如,健康板塊的無效比例最低,比平均的超鏈接無效比例低17個百分點(diǎn);而旅游板塊的無效比例則是最高的,比平均比例還要高出17個百分點(diǎn)。

其實(shí)話說回來,這種超鏈接失效的情形在網(wǎng)絡(luò)生活中并不少見。全媒派往期文章探討過“數(shù)字倉鼠”的現(xiàn)象,即很多網(wǎng)友喜歡把各種資料囤著,這其中也包括各種鏈接。你一定也有過這樣的經(jīng)歷,當(dāng)你打開自己所收藏的文章時,其中總有一些已經(jīng)被作者或者平臺刪除。


在微博中,這一現(xiàn)象更為常見,筆者驚奇地發(fā)現(xiàn)自己曾經(jīng)點(diǎn)贊或轉(zhuǎn)發(fā)的內(nèi)容幾乎一半以上都已經(jīng)成為無效的鏈接,只顯示“此微博已被刪除”。

另一種與鏈接無效相似的情形是內(nèi)容轉(zhuǎn)移(Content Drift)。

當(dāng)一個超鏈接的內(nèi)容被轉(zhuǎn)移則意味著,當(dāng)用戶點(diǎn)擊該超鏈接,服務(wù)器所返回的頁面并非原本所連接的內(nèi)容。

同樣,內(nèi)容轉(zhuǎn)移的情況也會隨著文章時間愈漸久遠(yuǎn)而變得更為頻繁。調(diào)查中提到,在2019年所發(fā)表的文章中,僅有4%的超鏈接內(nèi)容發(fā)生了變化;而2009年的文章中則有四分之一的超鏈接內(nèi)容發(fā)生了變化。

這樣的情況是否僅為個例?盡管該團(tuán)隊(duì)僅對《紐約時報》這一家機(jī)構(gòu)長達(dá)13年的文章進(jìn)行調(diào)查,素以存檔專業(yè)而著稱的《紐約時報》,其所屬文章超鏈接失效或內(nèi)容轉(zhuǎn)移的情況都如此普遍,其他規(guī)模更小的新聞機(jī)構(gòu)中的情況恐怕更不樂觀。

保存新聞并不只是保留原有的新聞文本或者音視頻資料,因?yàn)檫@些內(nèi)容往往都保存于新聞機(jī)構(gòu)自己的服務(wù)器中,相比之下,更為棘手的是保留文章中所引用的外部信息,也就是超鏈接。

超鏈接所導(dǎo)向的外部網(wǎng)站并不受相關(guān)新聞機(jī)構(gòu)的管理,這些網(wǎng)站的內(nèi)容能夠被第三方所修改或者刪除。其帶來的后果不只是新聞失去參考的信息來源或者新聞情境喪失,更嚴(yán)重的影響是,這些超鏈接可能會被用來導(dǎo)向無關(guān)的內(nèi)容,或被用于一些不正當(dāng)?shù)哪怖袨椤?/p>

凱瑟琳·漢森和諾拉·保羅在他們《給未來的新聞:保留歷史的第一稿》中表現(xiàn)出對于當(dāng)前新聞存檔現(xiàn)狀深深的擔(dān)憂。

在他們看來,新聞所發(fā)揮的作用遠(yuǎn)不僅僅只是傳遞當(dāng)下的信息,更為重要的是完整表現(xiàn)出時代的特征和人們的生活。[2]但隨著新聞行業(yè)數(shù)字化進(jìn)程不斷深入,新聞業(yè)大力推進(jìn)革新向前進(jìn)的同時卻忽視了往后面看一看。

占用“死去”的超鏈接成灰色產(chǎn)業(yè)

超鏈接之“死”暴露出兩個問題:一是新聞的儲存無法得到百分百妥善處理,另一方面則是超鏈接背后隱藏著巨大的地下市場。

因?yàn)榘鏅?quán)問題,新聞網(wǎng)站需要用超鏈接標(biāo)注所引用的資料來源,但這使得新聞網(wǎng)站對于超鏈接所指向的內(nèi)容缺乏控制,這就為投機(jī)者利用無效超鏈接埋下了隱患?;趦?nèi)容轉(zhuǎn)移等原理,非法供應(yīng)商可以將原本失效的超鏈接進(jìn)行偷換,重新連接到新的網(wǎng)站中,以此來吸引流量、謀取利益。

 儲存新聞的困境

相較于報紙、錄像帶等傳統(tǒng)的信息儲存形式,電子新聞的儲存無疑更加具有便利性。那為什么新聞儲存在電子時代反而會成為一個問題?

要回答這個問題,我們必須首先了解在傳統(tǒng)媒體時代新聞是如何進(jìn)行儲存的。

在數(shù)字化流行之前,新聞的主要形式是報紙、廣播以及電視。廣播和電視節(jié)目主要由新聞機(jī)構(gòu)自行進(jìn)行儲存,一般媒體都會設(shè)有專職人員對這些新聞原件進(jìn)行歸檔,其作用類似于圖書管理員。

報紙的保存則涉及到更為復(fù)雜的過程。由于各種機(jī)構(gòu)和個人都會訂閱報紙,人們在購買報紙的過程中也同時保留了新聞原件。雖然個人可能出于興趣保存有一定量的報紙,但這樣的行為往往也并不具有系統(tǒng)性。

主要的第三方保存機(jī)構(gòu)是大大小小的圖書館。圖書館具有更為寬敞的空間以及專業(yè)的圖書管理員,因此可以相對更為完整地保存報紙??梢哉f,報紙的儲存更為彌散化,除了新聞機(jī)構(gòu)本身,第三方機(jī)構(gòu)也會有所參與。

但隨著新聞業(yè)數(shù)字化程度不斷提高,互聯(lián)網(wǎng)成為新聞傳播的重要途徑。電子化的新聞似乎不再需要?dú)w檔,因?yàn)樗揪捅话卜旁诜?wù)器的不同文件夾中。

但實(shí)體的文檔和數(shù)字文檔畢竟存在差異,一份報紙一旦發(fā)行就難以再做改動,而數(shù)字文檔則始終保持著可變動性。尤其是諸如超鏈接等導(dǎo)向外部網(wǎng)站的渠道,其是否進(jìn)行修改或刪除取決于第三方機(jī)構(gòu),媒體無法對其進(jìn)行直接管理。

另一方面,對于新聞歸檔的忽視也顯示出新聞業(yè)整體的發(fā)展趨勢——追求速度。正如周睿鳴老師在論文中指出那樣,新聞業(yè)陷入與自我賽跑的泥淖,新聞生產(chǎn)成為不斷提速的過程。[3]在這樣不斷往前看的過程中,重視過去的新聞似乎有些不合時宜。

盡管人們開始意識到問題所在,但對于新聞機(jī)構(gòu)而言,完整、獨(dú)立地保存新聞依然存在諸多問題,版權(quán)問題無疑位于核心。如何既能夠尊重第三方資料來源的版權(quán),同時又能夠防止其不被居心叵測者所利用,這成為解決問題的關(guān)鍵。


一種可能的處理方式是備份第三方機(jī)構(gòu)的超鏈接頁面,如果無法一比一復(fù)制,還可以考慮截圖的形式。但這可能賦予新聞媒體過大的權(quán)力,使其能夠直接復(fù)制其他內(nèi)容來源;再者,這也促成了獨(dú)立、封閉的網(wǎng)絡(luò)生態(tài)體系的形成,使得流量始終在新聞網(wǎng)站內(nèi)部循環(huán)。

第三方機(jī)構(gòu)一般不會允許媒體借用它們所生產(chǎn)的內(nèi)容來增強(qiáng)媒體的用戶黏性。而一旦超鏈接導(dǎo)向外部網(wǎng)站,媒體就無法對其內(nèi)容進(jìn)行控制。因此,這一切處理起來并不容易。

超鏈接背后的灰色市場

如果媒體發(fā)布文章中的超鏈接導(dǎo)向的是一個完全無法控制的網(wǎng)站,那對于媒體公信力而言是存在風(fēng)險的,美國的媒體正飽受這種無效超鏈接被篡改之苦,而這背后就有一片巨大的灰色市場。

通常這些超鏈接的地址會被導(dǎo)向某些具有盈利性質(zhì)的網(wǎng)站,大多類似于廣告引流。

其運(yùn)作邏輯大致如下:正如前文提到的,新聞網(wǎng)站中大量的超鏈接內(nèi)容已然失效,但這些鏈接依然存在且可點(diǎn)擊;某些供應(yīng)商則將此作為契機(jī),尋找到新聞網(wǎng)站中的無效鏈接,將其替換成為客戶所需要的網(wǎng)站內(nèi)容。

這些被篡改的外部網(wǎng)站大多具有廣告性質(zhì),諸如推銷廉價酒店、在線咨詢、在線支付甚至包括網(wǎng)絡(luò)賭博等。

雖然人們對于過去新聞的興趣會逐漸下降,但互聯(lián)網(wǎng)中的新聞并不會因此完全被遺忘。通過搜索引擎,用戶能夠隨時調(diào)用過去的新聞報道。當(dāng)過去的“記憶”被喚醒時,伴隨著這些舊新聞一起重建天日的還有那些已經(jīng)被偷偷掉包的超鏈接。

當(dāng)用戶第一次發(fā)現(xiàn)超鏈接被篡改為毫無相關(guān)的廣告時,他也許只會感慨互聯(lián)網(wǎng)中的廣告真是無孔不入。但第二次、第三次呢?他可能就會對新聞網(wǎng)站的專業(yè)性產(chǎn)生質(zhì)疑了。更何況無效超鏈接的比例如此之高,誰也不知道下一個被點(diǎn)開的鏈接是否是其原本的內(nèi)容。

BuzzFeed新聞對于美國各大主要新聞網(wǎng)站以及BBC的調(diào)查發(fā)現(xiàn),這些新聞網(wǎng)站都深受超鏈接內(nèi)容篡改之苦,其中福布斯新聞所受影響尤其明顯。[4]

福布斯發(fā)言人在一次公開聲明中表示,網(wǎng)站已經(jīng)刪除這些被修改內(nèi)容的超鏈接,并且積極尋找能夠規(guī)避超鏈接被篡改的措施。BBC則在其網(wǎng)站上發(fā)布免責(zé)聲明,稱其對外部網(wǎng)站的內(nèi)容不承擔(dān)任何責(zé)任。

提供這些篡改服務(wù)的供應(yīng)商大多避開了來自美國或歐洲國家的直接監(jiān)管,其服務(wù)費(fèi)往往十分高昂,替換一條超鏈接內(nèi)容的服務(wù)費(fèi)從200到500美金不定。

替換超鏈接的行為是諸多黑帽SEO技術(shù)中的一種。SEO(Search Engine Optimization)指的是搜索引擎最優(yōu)化技術(shù),它主要用于分析搜索引擎如何進(jìn)行排名的規(guī)律,通過了解搜索引擎如何抓取互聯(lián)網(wǎng)頁面、怎樣確定特定關(guān)鍵詞等技術(shù)來提高網(wǎng)頁在搜索引擎中的排名已增加瀏覽量。[5]而黑帽SEO則是通過作弊的方式來提高網(wǎng)站的瀏覽量,以圖謀取短期、快速的經(jīng)濟(jì)效益。

為了以假亂真,供應(yīng)商有時甚至?xí)7略芯W(wǎng)站發(fā)布者的身份以圖迷惑用戶。例如,位于德里的一家SEO機(jī)構(gòu)曾替換了福布斯網(wǎng)站中梅根·梅森(Megan Mason)于2015年所發(fā)表文章中的某些無效鏈接。替換者用梅根·馬特(Megan Matt)的名義重新發(fā)布了一篇文章,并將其連接到圣地亞哥一家地毯清潔公司的網(wǎng)站。

新聞網(wǎng)站并非這些非法牟利者的唯一受害者,各大搜索引擎網(wǎng)站也飽受其苦,畢竟黑帽SEO會使得搜索結(jié)果無法滿足用戶的需求。當(dāng)用戶在搜索引擎中搜索某個關(guān)鍵詞所返回的都是無關(guān)的廣告甚至垃圾信息,用戶勢必會對搜索引擎所能提供的服務(wù)產(chǎn)生質(zhì)疑。

規(guī)避風(fēng)險亦不可因噎廢食

從大大小小的灰色產(chǎn)業(yè)服務(wù)商到他們?yōu)榇鄹某溄觾?nèi)容所提出的高額報酬,看似不起眼的無效超鏈接背后潛藏著巨大的利益空間。那為何不索性取消超鏈接?這樣就能從根本上遏制投機(jī)者用非法的渠道進(jìn)行牟利。

首先依然是版權(quán)問題。

超鏈接存在之初便是為了媒體能夠合法地使用外部網(wǎng)站中的內(nèi)容,使用超鏈接不但能夠標(biāo)注資料的出處,還能夠用最便捷的方式尋找到原初的資料。盡管通過增加尾注或者其他方式也能夠注明版權(quán),但超鏈接無疑是更合適的方式。

被篡改的超鏈接也折射出媒體對于版權(quán)的重視。即使深受黑帽SEO之?dāng)_,多數(shù)媒體也并沒有想要取消超鏈接,而是試圖用技術(shù)彌補(bǔ)當(dāng)前存在的不足。

其次也折射出媒體對于網(wǎng)絡(luò)生態(tài)的態(tài)度。

正如筆者在前文中指出,沒有超鏈接的文章形成了封閉的網(wǎng)絡(luò)生態(tài),用戶只能在網(wǎng)站中瀏覽該媒體內(nèi)部的信息,不同網(wǎng)站之間也沒有任何聯(lián)系。

而超鏈接恰恰提供了連接的可能,只需要輕輕一點(diǎn),用戶即可瀏覽其他渠道的頁面。不同新聞之間,甚至不同新聞網(wǎng)站之間都能通過超鏈接進(jìn)行關(guān)聯(lián)。

這樣帶來的一個好處是,不同媒體之間依靠內(nèi)容質(zhì)量來吸引受眾,技術(shù)本身并不成為壁壘,甚至雙方都樂見對方生產(chǎn)更加優(yōu)質(zhì)的內(nèi)容。

總而言之一句話,盡管失效超鏈接背后潛藏著巨大的灰色市場,盡管第三方投機(jī)者的行為給新聞網(wǎng)站帶來了棘手的問題,但行業(yè)也并沒因噎廢食,媒體機(jī)構(gòu)依舊試圖通過提升技術(shù)手段來降低潛在風(fēng)險。

被篡改的超鏈接也提醒我們,盡管互聯(lián)網(wǎng)不是法外之地,但是試圖鉆技術(shù)和規(guī)則漏洞的投機(jī)者依然大有人在。如《紐約時報》這些在內(nèi)容存儲上相對專業(yè)的新聞媒體所引用的超鏈接都有可能被第三方所盜用,其他網(wǎng)站中可能存在的“陷阱”無疑會更多。而這些,都有待平臺、媒體和相關(guān)監(jiān)管機(jī)構(gòu)合力形成更嚴(yán)密的預(yù)防和處理機(jī)制。

參考鏈接:

  • 1.https://www.cjr.org/analysis/linkrot-content-drift-new-york-times.php
  • 2.https://www.cjr.org/tow_center_reports/the-dire-state-of-news-archiving-in-the-digital-age.php
  • 3.周睿鳴.錨定常規(guī):“轉(zhuǎn)型”與新聞創(chuàng)新的時間性[J].新聞記者,2020(02):21-31.
  • 4.https://www.buzzfeednews.com/article/deansterlingjones/links-for-sale-on-major-news-wesbites
  • 5.馬曉玲,吳永和.對于搜索引擎優(yōu)化(SEO)的研究[J].情報雜志,2005(12):119-121.

我們身邊常見的超鏈接,有許多竟然已經(jīng)“死”了。你遇到過點(diǎn)擊超鏈接跳轉(zhuǎn)到一個莫名其妙的網(wǎng)站的現(xiàn)象嗎?歡迎在評論區(qū)分享你的奇怪體驗(yàn)~

—— 如果覺得文章還OK,請轉(zhuǎn)發(fā) ——

特別提示:關(guān)注本專欄,別錯過行業(yè)干貨!

PS:本司承接 小紅書 / 淘寶逛逛 / 抖音 / 百度系 / 知乎 / 微博/大眾點(diǎn)評 等 全網(wǎng)各平臺推廣;

咨詢微信:139 1053 2512 (同電話)

首席增長官CGO薦讀:

更多精彩,關(guān)注:增長黑客(GrowthHK.cn)

增長黑客(Growth Hacker)是依靠技術(shù)和數(shù)據(jù)來達(dá)成各種營銷目標(biāo)的新型團(tuán)隊(duì)角色。從單線思維者時常忽略的角度和高度,梳理整合產(chǎn)品發(fā)展的因素,實(shí)現(xiàn)低成本甚至零成本帶來的有效增長…

本文經(jīng)授權(quán)發(fā)布,不代表增長黑客立場,如若轉(zhuǎn)載,請注明出處:http://allfloridahomeinspectors.com/quan/40757.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
上一篇 2021-06-16 10:43
下一篇 2021-06-16 11:34

增長黑客Growthhk.cn薦讀更多>>

發(fā)表回復(fù)

登錄后才能評論