91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Web爬蟲現(xiàn)在是不是合法了

Wildesbeast ? 來源:今日頭條 ? 作者:Tom Waterman ? 2020-02-04 14:45 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

技術(shù)無罪?江湖傳言,互聯(lián)網(wǎng)上50%以上的流量都是由爬蟲創(chuàng)造的,很多人都表示:無爬蟲就無互聯(lián)網(wǎng)的繁榮。也正因為此,網(wǎng)上各種爬蟲教程風(fēng)靡不絕,惹各路大神小白觀之參與之。但是,無節(jié)制的背后往往隱藏著風(fēng)險,類似“只因?qū)懥艘欢闻老x,公司200多人被抓!”、“程序員爬蟲竟構(gòu)成犯罪?”等報道也時有發(fā)生。關(guān)于爬蟲合法性的討論,CSDN也在此前的《爬蟲到底違法嗎?這位爬蟲工程師給出了答案》、《不要在爬蟲犯罪的邊緣瘋狂試探!》等文章中進行了探討——但是,關(guān)于爬蟲的爭論一直甚囂塵上。

近日,美國法院駁回 LinkedIn 針對分析公司 HiQ 抓取其數(shù)據(jù)的申訴一事件,似乎又為網(wǎng)絡(luò)爬蟲的自由添磚加了瓦。決議表明:任何可公開獲得且未經(jīng)版權(quán)保護的數(shù)據(jù)都可供抓取!可以說,這是數(shù)據(jù)隱私和數(shù)據(jù)監(jiān)管時代的歷史性時刻。那么,作為開發(fā)者的你,如何看到這一事件呢?關(guān)于爬蟲的風(fēng)險性又該怎么定論?

2019年末,美國上訴法院駁回了 LinkedIn 針對分析公司 HiQ 抓取其數(shù)據(jù)的申訴。

這項決議是數(shù)據(jù)隱私和數(shù)據(jù)監(jiān)管時代的歷史性時刻。這項決議表明,任何可公開獲得且未經(jīng)版權(quán)保護的數(shù)據(jù)都可供網(wǎng)絡(luò)爬蟲自由抓取。

但是抓取數(shù)據(jù)的商業(yè)用途仍然有限

然而,這項決議并沒有授予 HiQ 或其他網(wǎng)絡(luò)爬蟲將抓取獲得的數(shù)據(jù)用于商業(yè)目的的自由。

例如,網(wǎng)絡(luò)爬蟲可以在 YouTube 上搜索視頻標(biāo)題,但由于這些視頻已獲得版權(quán),因此不可以將 YouTube 視頻轉(zhuǎn)發(fā)到自己的網(wǎng)站上。

一般來說,無論你以何種方式獲取數(shù)據(jù),數(shù)據(jù)(包括視頻或音樂之類的媒體文件數(shù)據(jù))的版權(quán)依然有效。

某些形式的網(wǎng)頁爬蟲仍然是非法的

這項決議也沒有賦予網(wǎng)絡(luò)爬蟲自由地從需要身份驗證的站點獲取數(shù)據(jù)的權(quán)利。

例如,根據(jù)規(guī)定網(wǎng)絡(luò)爬蟲不可以登錄到 Facebook 并下載用戶的數(shù)據(jù)。

該規(guī)則不包括那些要求用戶在認證之前必須同意使用條款的網(wǎng)站,因為通常這些服務(wù)條款都會禁止諸如自動收集數(shù)據(jù)之類的活動。

但是,由于公開站點無法要求用戶在訪問數(shù)據(jù)之前同意任何服務(wù)條款,因此用戶可以自由使用網(wǎng)絡(luò)爬蟲程序從站點收集的數(shù)據(jù)。

各個網(wǎng)站仍然可以使用技術(shù)來限制網(wǎng)絡(luò)爬蟲

盡管如今各個公司不太可能通過法律途徑應(yīng)對網(wǎng)絡(luò)爬蟲程序,但他們?nèi)匀豢梢酝ㄟ^其他方式限制網(wǎng)絡(luò)爬蟲。

例如,各個網(wǎng)站可以使用“限速”等技術(shù)來防止爬蟲程序一次下載太多網(wǎng)頁。此外,各個網(wǎng)站還可以使用 CAPTCHA 等技術(shù)來測試是用戶還是網(wǎng)絡(luò)爬蟲正在請求該頁面。

這些技術(shù)通常用于防止惡意機器人導(dǎo)致網(wǎng)站超載,引起網(wǎng)站崩潰。但是,這些技術(shù)也可以廣泛用于限制網(wǎng)絡(luò)爬蟲的自動抓取。

LinkedIn可能會進一步上訴

盡管美國上訴法院駁回了LinkedIn的請求,但他們可能還有最后一步棋:向美國最高法院提出上訴。

美國最高法院有權(quán)推翻上訴法院的判決,而且還可以撤銷網(wǎng)絡(luò)爬蟲公開使用非版權(quán)數(shù)據(jù)的合法化。但是,并非所有上訴至最高法院的決定都能得到實際的審查。

但是,我們?nèi)匀豢梢哉J為最高法院很可能會審查本案的裁決。畢竟數(shù)據(jù)政策和相關(guān)的隱私問題是相對較新的法律,而且會對 LinkedIn 等公司產(chǎn)生重大的商業(yè)影響。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Web
    Web
    +關(guān)注

    關(guān)注

    2

    文章

    1304

    瀏覽量

    74429
  • 爬蟲
    +關(guān)注

    關(guān)注

    0

    文章

    87

    瀏覽量

    8087
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    CW32F030是不是支持keil?

    各位大佬,請問CW32F030是不是支持keil ???
    發(fā)表于 01-19 07:02

    京東關(guān)鍵詞搜索商品列表的Python爬蟲實戰(zhàn)

    ?。?京東擁有商品數(shù)據(jù)的版權(quán),爬蟲僅可用于 個人學(xué)習(xí)、研究 ,禁止用于商業(yè)用途、批量爬取造成京東服務(wù)器壓力。 遵守京東《用戶協(xié)議》和robots.txt協(xié)議(京東https://www.jd.com/robots.txt明確限制部分
    的頭像 發(fā)表于 01-04 10:16 ?677次閱讀

    請問使用ChirpIoT 是不是可以實現(xiàn)mesh組網(wǎng)?

    使用ChirpIoT 是不是可以實現(xiàn)mesh組網(wǎng)?
    發(fā)表于 12-11 06:58

    鴻蒙系統(tǒng)對手機市場會產(chǎn)生怎樣的影響?現(xiàn)在汽車是不是也用上鴻蒙系統(tǒng)?

    鴻蒙系統(tǒng)對手機市場會產(chǎn)生怎樣的影響?現(xiàn)在汽車是不是也用上鴻蒙系統(tǒng)?
    發(fā)表于 12-04 20:47

    請問IR 調(diào)制器是不是復(fù)用串口的???

    請問,IR 調(diào)制器是不是復(fù)用串口的啊?
    發(fā)表于 11-26 06:36

    # 深度解析:爬蟲技術(shù)獲取淘寶商品詳情并封裝為API的全流程應(yīng)用

    需求。本文將深入探討如何借助爬蟲技術(shù)實現(xiàn)淘寶商品詳情的獲取,并將其高效封裝為API。 一、爬蟲技術(shù)核心原理與工具 1.1 爬蟲運行機制 網(wǎng)絡(luò)爬蟲本質(zhì)上是一種遵循特定規(guī)則,自動抓取網(wǎng)頁信
    的頭像 發(fā)表于 11-17 09:29 ?337次閱讀

    配置串口DMA,現(xiàn)在是接收可以,發(fā)送不行,是什么地方?jīng)]有設(shè)置對嗎?

    配置串口DMA,現(xiàn)在是接收可以,發(fā)送不行,是什么地方?jīng)]有設(shè)置對嗎?當(dāng)配置DMA_TX 不能發(fā)送數(shù)據(jù),默認輪詢發(fā)送就可以。配置如下圖:
    發(fā)表于 09-28 07:41

    從 0 到 1:用 PHP 爬蟲優(yōu)雅地拿下京東商品詳情

    PHP 語言 實現(xiàn)一個 可運行的京東商品爬蟲 ,不僅能抓取商品標(biāo)題、價格、圖片、評價數(shù),還能應(yīng)對常見的反爬策略。全文附完整代碼, 復(fù)制粘貼即可運行 。 一、為什么選擇 PHP 做爬蟲? 雖然 Python 是爬蟲界的“老大哥”
    的頭像 發(fā)表于 09-23 16:42 ?847次閱讀
    從 0 到 1:用 PHP <b class='flag-5'>爬蟲</b>優(yōu)雅地拿下京東商品詳情

    對于沒有bsp包,也沒有芯片創(chuàng)建的功能是不是就不能用rtthread?

    公司用的冷門芯片,不能生成BSP包,然后發(fā)現(xiàn)芯片創(chuàng)建也沒有,是不是不能用rtthreead?
    發(fā)表于 09-23 08:27

    at_device(8266)不支持web服務(wù)器嗎?

    現(xiàn)在想用esp8266 at device 做一個網(wǎng)頁服務(wù)器 但是文件系統(tǒng)什么都做好了 運行webnet_test 顯示下邊的錯誤 查論壇 說at不支持服務(wù)器 但是是20年的帖子 現(xiàn)在
    發(fā)表于 09-23 06:09

    Nginx限流與防爬蟲配置方案

    在互聯(lián)網(wǎng)業(yè)務(wù)快速發(fā)展的今天,網(wǎng)站面臨著各種流量沖擊和惡意爬蟲的威脅。作為運維工程師,我們需要在保證正常用戶訪問的同時,有效防范惡意流量和爬蟲攻擊。本文將深入探討基于Nginx的限流與防爬蟲解決方案,從原理到實踐,為大家提供一套完
    的頭像 發(fā)表于 09-09 15:52 ?901次閱讀

    請問STM32的內(nèi)部Flash操作是不是優(yōu)先級最高?

    STM32的內(nèi)部Flash操作是不是優(yōu)先級最高?目前在內(nèi)部Flash的單獨一頁存儲數(shù)據(jù),發(fā)現(xiàn)在進行頁擦除的時候正常工作的定時器中斷無法進入了
    發(fā)表于 08-13 07:03

    光纖跳線是不是就是尾纖

    光纖跳線和尾纖不是同一種東西,它們在多個方面存在明顯區(qū)別: 定義與用途 光纖跳線 定義:光纖跳線也叫光纖連接器,是兩端都帶有連接器的光纖線纜,用于連接設(shè)備與設(shè)備、設(shè)備與光纖配線架等,實現(xiàn)光信號的傳輸
    的頭像 發(fā)表于 06-18 09:58 ?994次閱讀

    爬蟲數(shù)據(jù)獲取實戰(zhàn)指南:從入門到高效采集

    爬蟲數(shù)據(jù)獲取實戰(zhàn)指南:從入門到高效采集 ? ? 在數(shù)字化浪潮中,數(shù)據(jù)已成為驅(qū)動商業(yè)增長的核心引擎。無論是市場趨勢洞察、競品動態(tài)追蹤,還是用戶行為分析,爬蟲技術(shù)都能助你快速捕獲目標(biāo)信息。然而,如何既
    的頭像 發(fā)表于 03-24 14:08 ?1532次閱讀

    請問stm32f373中SDADC和ADC的1.2V片內(nèi)基準(zhǔn)是不是同一個?

    VREFSD表述。 比如在RM中,寫成:Internal bandgap: VREFSD = 1.2 V 現(xiàn)在是,我不清楚這個VREFSD和和DATASHEET里的Embedded reference voltage是不是同一個基準(zhǔn)源?感覺文檔表述比較混亂,無法確定。 請
    發(fā)表于 03-13 07:39