当前位置: 首页 >  投资组合

美国数据爬虫相关案例判决梳理

发布日期:2020-05-31

根据Imperva发布的bot traffic report 2016,超过一半以上的互联网访问是|︴()〔〕由自动bot产生的,这意味着接近每20次互联网访问中,就有一次是爬虫。

爬虫技术在互联网中广泛应Ⅲ用也引起了诸多问题。例Ψ如,竞争对手为了充分了解其他从业者的经营情况,服务于自己的商业决策,会对竞品网站进行爬虫。

这类案子在美国已经发生了不少,今天就选择了几个典型的案子,从法官如何解释文本的角度,简单介绍下美国法官是如何处理这类η问题的,以及∏我的一些思考¤和疑问。

美国法院在应对爬虫相关问题涉及的法律渊源包括:合同法、著作权法、CFAA、侵权法、隐私法。这需要具体看爬取的数据类型和爬取方式予以区分,例如爬取的数据属于有版权的书籍、视频,那么著作权法的权重会大一些,如果爬取的是社交网络的非公开信息,可能隐私法的权重会大一些。

其中CFAA是最重要的法律依据了,其中CFAA的1030(a)(5)(A)(2008)这条,是被援引最多⺌的条款,那我们来看看这一条规定了什么?

•《1986年计算机欺诈与滥用法》ComputerFraud and Abuse Act of 1986(CFAA)

intentionally accessed a computer without authorization or exceeded authorized access,and thereby obtained…information from any protected computer;” or that the defendant “knowingly caused the transmission of aprogram…and…caused damage without authorization to a protected computer. 18U.S.C. 1030(a)(2)(C), 1030(a)(5)(A┈┉) (2008).

•未经授权故意访问计算机或超过授权访问权限,◥从而从任何受保护的计算机获取信息;或者被告“故意造成程序传输,并且对未经授权且受保护的计算机造成损害”

怎么理解“未经授权”、“超过授权访问权限”,以及“受保护的计算机”,成为法官是否能通过CFAA对Θ爬虫行为追责的重要依据。by the wa⊙y,CFAA不仅规定了民事责任,还有刑事责任。

如果从字面上去理解,“未经授权”最plainly的意思就是在&访问时候没有获得权限。那么网站¤就可以通过在事前,发表明确声明来表示禁止爬虫行为。我大致梳理了下(并不代表美国司法界对这种分类方法认同),这类事前▧声明可以被分为两类:明示的or暗示的

明示的“未经授权”包括与员工签署的保密协议、网页上的告知、警告、弹窗、最终用户协议、产品或服务备注的说明、解释等。≥

暗示的“未经授权”包括密码认证,例如在登陆某个网站的时候需要输入密码,这就在暗示用户需要得到通过密码来获取访问权限,如果绕开了认证予以暴力访问,那么可以被推定为“未经授权”。

OK,说一千道一万,不如来看案子。

1、EFCultural гTravel BV v. ZeferCorp., 318 F.3d 58, 62 (1st Cir. 2003)

EF是一家主打学生旅游◢市场的公司,几位EF员工签了保密协议后离职,另起炉灶,☆然后利用之前在公司工作期间知晓的价格代码(T∮hese codes were used to direct the scraper tool to the specific pages on EF’s website that contai♨ned EF’s pricing information),加之开发的爬虫软件,对EF公司的网站进行爬虫,找到公众访问者无法搜到的低价,然后依据该价格参与竞争。

最后EF就告到法院。法院认为If EF wants to ban scrapers, let it say so on the webpage or a link clearly marked as contai┝ning restrictions。也就是说所谓的CFAA的“未经授权”,可以通过网站发表“限制访问”的明确声明,予以确立。并且这几位离职员工的离职保密协议中也有相关规定,最后也被法院一并援引用来支撑判决。

2、SouthwestAirlines Co. v. Farechase,Inc., 318 F. Supp.2d 435, 439–440 (N.D. Tex. Mar. 19, 2004)

Farechase公司开发了一个爬虫软件,对西南航空公司的▐网站进行爬虫。西南航空在其网站的每一页都明确禁止了爬虫("repeated warnings and requests to stop scraping,")。那Ⅺ么该声明被法院确立为“未经授权”的行为,援引了CFAA予以处罚。

3、CollegeSource,Inc. v. AcademyOne,Inc., 597 Fed.Appx.116, 130 (3d Cir. 2015) 

CollegeSource是一家专注于做美国大学生转校咨询的公司,同时也提∽供很多在线大学课程,Acdaemy One经营类似业务。因为竞争,A1公司也想收集并建立自己的学习资源库给用户使用,所以雇佣了一个中国承包商,写了一个爬虫的脚本,对ColledgeSource公司网站的资源进行爬虫,共收集了超过18000份pdf文档。

在这些pdf文档的第二页,都有一个明确的条款说明:禁止在任何未经同意的情况下,进行重新分发、修改或商业使用。

2007年4月,CollegeSource公司就给A1公司发了一封禁令信,要求其停止爬虫。法院认定“违反任何技术壁垒或合同使用条款”,都可以被解释为“未经授权ъ”。也就是说如果网站页面上没有说明,但是提供的相关产品or服务里有相关明确说明,一样可以被认定。

4、EarthCam,Inc. v. OxBlueCorp., 7〧03 Fed.Appx.803, 808 (11th Cir. 2017) 

这个案子有点趣。

EC和OxBlue都是经营影像器材和解决方案的公司。EC的一个用户将自己账户密码给了OxBlue公司,希望经营类似业务的OxBlue能帮忙解决一些技术⌒问题。后者登录了该账户密码,并对EC社群论坛上的大量图片等其他信息进行抓去。EC控诉至法院。

法官最后还是支持了EC,但是理由很有意思:虽然CFAA并没有明确规定用户不得与他人共享账户信息,甚至用户都可以把账户密码在网上公开都是ok的,但是EC网站上明确声明如果用户将账户信息给他人使用,违反了其”使用条款“。

法官认为,这属于CFAA认定的”超出权限“——网站只授权给当事人使用,其他人用当然超出了权限。也就是说,如果违反了有关涉案计算机的任︱︳何政策或使用条款(EULA),可以被认定为“超出了授权访问权限”。

5、Cvent,Inc. v. Eventbrite, Inc., 739 F.Supp.2d 927 (2010) (UnitedStates District Cour∈t, E.D. ○Virginia)

这个案子属于某种例外情形。

该公司的使用条款,被放在网页的最下面,并且和一堆其他网站的链接混在一起。很难被用户看到。所以法官要求“使用条款”必须显而易见,否则不对爬虫者有效。

小结一:

如果网站有明确的声明、告知、警告、弹窗禁止爬虫、或♀者违反╟员工保密协议、合同、产品或服务中的备注说明解释、最终用户协议,都可能被法院认定为CFAA规定的“未经授权”或“超出授权”的行为,依此可以予以确立刑事、民事责任。

那么什么是“事后措施”?让我÷们看两个案例:

6、CraзigslistInc. v. 3Taps Inc., 942 F. Supp. 2d 962 (N.D. Cal. 2013)

Craiglist是一个风格迥异的分类信息网站,类似于国内早期的58同城。3Taps就从CL上进行爬虫,然后再自己网站上做聚合展示。

CL就向3taps发了律师禁令信(cease-and-desistletter)并且屏蔽了3taps公司的IP来限制其访问CL,要求停止行为。但是3Taps也采用技术手段绕开了屏蔽继续爬。CL就说,那好吧,法庭见。

虽然CL网站上的使用条款有明确声明禁止爬虫,但法官并不认同该声明可以触发CFAA监管。但法官认可了CL的事后采取的函告声明行为和技术手段,认定为“未经授权”的访问行为,触发↕CFAA。

7、Facebook,Inc. v. Power Ventures, Inc. et al., 844 F.3d 1058 (9th Cir. 2016)

该案与CL v. 3Taps案类似。第九巡回法院ц维持原判,在有明确函告和技术手段的情况下,构成“未经授权”。

小结二:

部分я法院认为,仅凭“使用条款”无法被解释为CFAA规定的“未经授权”或“超出授权”的行为,但事后的函告或技术性手段,依旧可以被认定为“未经授权”或“超出授权”行为的依据。

虽然事前的声明来触发CFAA已经开始被部分法院抛弃,不过事后的声明和技术手段开始被法官予以认可。但是,依靠网站的单方声明来决定是否触发CFAA越来越暴露出它的问题。到了2017年的hiQLabs, Inc. v. LinkedIЁn Corp案,事情有了彻底转变的可能....

8、hiQLabs, Inc. v. LinkedIn Corp., 273 F. Supp.3d 1099 (N.D. Cal. 2017)

这个案子的事实部分想必大家都烂熟于心了,我就不赘述了。

为什么说hiQ这个案子重要呢?我觉得意义有三:

a.这是加州法院第一次正面回应爬取“公开”信息的法律问题。法院认为爬虫公开信息不构成CFAA意义上的“未经授权”或“超出授权”行为,因为公开信息不同于CFAA法条中阐明的“anyprotected computer”,其缺少相应的保护措施,例如密码。大家来看看法官怎么说的:

b.第一次援引了反不正当竞争法(California’sUnfair Competition Law,UCL)作为支持爬虫方的判决依据。认定领英公司传导了其在职场社交领域的竞争优势到职场数据分析领域,该侵害不可修复。该理由成为法院发布临时禁令最直接的原由。

c.援引了加州宪法言论自由条款作为依据。认为“使用条款”给予了网站所有者过℅大的权力。看看法官怎么说:

此外,且仅凭“使用条款”不得触发CFAA。前面已经说过,CFAA最高可以判处刑事责任,想想如果仅凭网站单方的一个声明用来确定刑事责任,会是多么不么不稳定的情形(按照大陆法系的理解,刑法的谦抑性和罪责刑相适应就很难做到)

小结三:

近期的判决可能标志着CFAA法案下对网络爬虫行为责任认定的转变。对于网站所有者来说,如果爬取的是公开信息,那么Π通过事前的“使用条款”,事▁▂▃▄后的禁令通知、实施I灬P封锁技术都可能不再有效。

此外,对爬虫提起诉讼可能还会让网站所有者面对来自反不正当竞争法规以及宪法第一修正案方面的挑战。有关公开信息爬虫的判决正在慢慢突破合同法思维和CFAA的限制,开始更多的考量∷公共利益的优先性。

虽然案子已经打到了第九巡回法院待审,最后效力有待进一步观察,但它的影响力已经开始产生。例如2018年的Ticketm¨asterL.L.C. v. Prestige Entertainment, Inc. et al., No. 17-cv-07232, 2018 WL 654410(C.D. Cal. Jan. 31, 2018),法院否定了在仅有函告的情况下,不够触发CFAA。算是对hiQ案的一个回应。

hiq v. linkedin案被上诉至9th circuit在某404视频网站上有响应的录播,感兴趣的同学可以去观摩下。

不知道大家有没有注意到:

这几个案子里,法官和律师们似乎都回避了数据归属问题。这种现象不仅存在于企业间爬虫纠纷的案例中,在行业准入、数据交易等判决中,美国法官似乎也不愿过分纠结数据的归属问题。

例如Sorrellv. IMS Health Inc., 564 U.S. 552和FTCv. Toysmart.com案中,数据挖掘、处理、分析过程中的权属问题也并非案件的争议点。这和我国多起企业间数据纠纷中,有部分企业主张:“数据归属于用户”的落脚点非常不一样。

疑问:

对数据的法律权属进行界定,是不是解决数据纠纷不可绕过的法律问题?或者说,在什么情况下,对数据的产权予以明确是必۩..要且可行的?

科技创新正触发新一轮物流竞争序幕,新物流比拼的是跨界整合能力和大数据算法等科技能力。在Σ此新形势下,整个行业、企业如何抓住在新一轮物流竞争中的新机遇?又№如何实现内部Ж产业变革与升级,创造出新的竞争优势?

基于Ψ这些观察与了解,亿欧├物流将于9月20日在北京举办以“科技赋能 智创未来”为主题的——GIIS 2019第四届物流科技创新峰会。如今,峰会嘉宾与议程已经公布,报名通道也已开启,感兴趣的朋友,快马加鞭来参会!

报名链接:https://www.iyiou.com/post/ad/id/853

本文已标注来源和出处,版权归原作者所有,如有侵权,请联系我们。

  • 重磅!央行公布金融科技发...

    近日,中国人民银行印发《金融科技(FinTech)发展规划(2019-2021年)》(以下简称《规划》),明确提出未来三年金融科技工作的指导思想、基本原则、发展目标、重点任务和保障措施。 《规划》指出,金融科技是技术驱动的金融创新。金融业要以习近平新时代中国特色社会主义思想为指导,全面贯彻党的十九大精神,按照全国金融工作会议要求,秉持“守正创新、安全可控、普惠民生、开放共赢”的基本...

  • TigerWit:【外汇...

    function ImgReSize(e) { if(e.width>540) // 670可根据你文章的内容区域大小,可调整 { e.width=540; // 等同上面你设的那个数值 e.style.width=""; } if(e.height>10) { e.style.height=""; } } ...

  • 美国数据爬虫相关案例判决...

    根据Imperva发布的bot traffic report 2016,超过一半以上的互联网访问是由自动bot产生的,这意味着接近每20次互联网访问中,就有一次是爬虫。 爬虫技术在互联网中广泛应用也引起了诸多问题。例如,竞争对手为了充分了解其他从业者的经营情况,服务于自己的商业决策,会对竞品网站进行爬虫。 这类案子在美国已经发生了不少,今天就选择了几个典型的案子,从法官如何解释文...

  • 进击的方大集团:5亿入主...

    新京报讯(首席记者 赵毅波)持续扩张之下,辽宁方大集团的第4家上市公司浮出水面。3月29日午间,中兴商业公告,3 月 28 日接到控股股东中兴集团书面通知,获悉 中兴集团与辽宁方大集团签署了《股份转让协 议》。中兴集团向辽宁方大集团拟协议转让其所持有的公司无限售条 件流通股 80911740 股股份,占公司总股本的 29...

  • 【最美保险人】最美保险理...

    自加入信达财险青岛分公司以来,严苛牢记公司:“为客户提供保障,为股东创造价值,为员工搭建舞台,为社会分担责任”的发展使命,时刻提醒着自己用心地服务每一位出险的客户。每一次现场查勘、定损,都从服务于客户的角度出发,想客户所想,帮客户所需,用最快、最直接的方法帮助客户解决问题,用真诚的服务换取客户的满意和笑容。 平时,为了提高...

  • 铂略中外籍雇员个税合规与...

    10月24日,由铂略财务培训主办的中外籍雇员个税合规与规划论坛在上海明捷万丽酒店成功落幕。共有近250名来自于各大企业的财务及人力资源精英出席了本次论坛,偌大的会场座无虚席。 “目前在中国,个人所得税使用的...

  • 产业规划未提补贴,中国新...

    12月3日,工信部开始就备受关注的《新能源汽车产业发展规划(2021-2035年)》(征求意见稿)(以下简称“《规划》”)公开征求意见。值得注意的是,在支持政策方面,《规划》并未提及补贴问题。这些表述引发了业内部分企业关于补贴退坡过急的担忧,尤其是当前新能源汽车行业正面临市场需求疲软、产业转型升级困难等问题。对此,工信部...

  • 非建筑企业提供建筑服务如...

    根据《销售服务、无形资产、不动产注释》(财税〔2016〕36号文印发)的规定,建筑服务,包括工程服务、安装服务、修缮服务、装饰服务和其他建筑服务,分别对应于《商品和服务税收分类与编码(试行)》中的「305...

  • 中国商务部回应美拟对华2...

      在6日下午举行的中国商务部例行发布会上,有媒体提问时指出,美国对华2000亿美元输美商品征税征询公众意见结束,尽管超过9成参与者持反对意见,但有消息称川普寻求在公众意见征询期结束后继续推进对华关税措施,中国商务部新闻发言人对此给出了明确回应。  ​高峰表示:一段时间以来,美方严重违反世贸组织规则,不断出台单边措施,使中美贸易摩擦持续升级,既损害了中美两国企业和消费者利益,也损害了全球产业链和价...

  • 国家税务总局绍兴市税务局...

    国家税务总局绍兴市税务局关于公布全文失效废止的税收规范性文件目录的公告 国家税务总局绍兴市税务局公告2018年第3号        2018-7-5   为贯彻落...

  • 国泰港龙明起停飞武汉 部...

    新京报讯(记者 张泽炎)1月23日,国泰港龙航空表示,因应对武汉最新的情况,国泰港龙将由明天(2020年1月24日)开始暂停往来武汉的航班,直至2020年2月29日止。国泰港龙表示,公司现正密切监察情况,并会继续与本港及所有航点的卫生当局保持紧密联系。该公司的顾客服务同事会协助受影响的乘客安排退票或延后旅程。1月23日,...

  • 武汉“封城”首日:多银行...

    新京报讯(记者 程维妙 顾志娟)“根据武汉市新型冠状病毒防疫指挥部第1号通告,为防范疫情传播,招商银行武汉市区网点营业时间调整:1月23日:9时至12时;1月24-30日(春节期间),不营业。”1月23日,武汉宣布“封城”后,招行给持卡人发送了营业时间调整的短信通知。新京报记者致电武汉地区多家银行了解到,工行、农行、中行...