高峰财经网
您当前的位置:高峰财经网资讯正文

码农慌不慌只因写了一段爬虫大数据公司200多人被抓

文/责任编辑NO。石雅莉03212019-10-22 17:39:39  查看次数:2600  

“一个码农写了个爬虫程序,整个公司200多人被端了。”

“不或许吧!”

做为一名码农来讲,谁还没有写过几段爬虫呢?只因写爬虫程序就被端有点夸大了吧。

可是,实际便是很严酷,这个案子现在现已进入审判阶段。听说,涉案的码农在被警方抓捕后,在详细询问期间一向不供认自己冒犯了法令,而且也彻底没有意识到自己犯法了。进去之后总以为差人搞错了,过几天就会把自己放出来,成果也错过了取保候审的时机。

间隔事发当日到现在,现已过去了半年,当事者还被关在监狱中。不论这件事怎样收尾,对这名程序员和他的家庭都是一个很大的冲击。

一个爬虫引发的案子

某一个闻名互联网公司,忽然发现公司的服务器接连几天压力倍增,导致公司内部体系溃散不能拜访,公司领导责令技能部赶快处理。

该公司体系平常拜访量一向比较平稳,但不知为何这几天体系压力忽然大增,经过技能人员几天查询发现了一个惊人的本相,公司客户信息被抓取,而且某个接口拜访量巨大。

跟着技能人员的深入查询发现的现象愈加震动,侵略者使用这个进口现已盗取了许多的客户信息,而且一切的头绪都指向了一家大数据公司。

这家公司的首要事务便是,出售简历数据库。经核对该公司出售的简历数据中,就包括自己家客户的简历信息。

技能部上报领导之后,公司开会协商后决议报案。

爬虫把对方服务器搞挂了

案发前一段时间,小明(化名)接到了技能部领导的需求,要求写一段爬虫批量从网上的一个接口抓取数据,爬虫开发完后测验没有问题,小明就将程序上传到了公司服务器。

程序运转了一段时间后,也许是有了新的需求,也许是小明想对爬虫程序进行进一步的优化,将爬虫的线程数,由本来比较小的值调到一个比较大的值。

完善后的程序上传到服务器后,小明盯梢了下爬虫的发展,运转平稳而且速度快了许多。提交之后像平常相同,小明就把这件作业忘了。

小明没想到自己这次提交的爬虫程序,居然能把对方的服务搞挂了,也没想到自己由于写了一段代码而坐牢。

整个公司200多人被抓

2019年的某一个作业日,公司职工像平常相同忙忙碌碌,某个程序员和产品司理正在为了一个需求争持,小明带着耳机正坐在办公室敲代码。

忽然就来了一大群差人,要求一切人脱离工位,双手脱离电脑、手机等设备。整个公司的人都懵了,不知道发生了什么作业,但也都照办了。

差人很快查封了公司的一切办公用品,问技能部相关人员要了服务器的信息,公司整体上下 200 多人无差别的悉数送到看守所了解情况。

在去看守所的路上,咱们都还心里想这是不是搞错了,咱们仅仅一个科技公司公司又没有哄人,怎样就集体被抓了。

小明也一向以为自己没有违法,自己仅仅一名技能人员罢了,一切的作业也都是依照领导要求来履行的,应该很快就会把咱们开释了吧。

随后,公司非中心人员都被开释了出来,首要会集在 HR、行政人员。最终承认公司 36 人被捕,其间大部分是程序员。

被捕后小明托付的律师事务所,便是和咱们沟通的两位律师的事务所,听说小明入狱后就一向不以为自己有罪,也因一向回绝认罪然后错过了取保候审的时机。

现在小明还在等候最终的审判。。。

把握2.2亿人简历大数据,年赚1.8亿

巧达科技号称是我国最大的用户画像要害数据服务供给商,专心于大数据及人工智能范畴前瞻性产品研制,客户掩盖互联网工作及泛金融范畴。

高管多为百度身世,公司2017年净赚1.86亿元。

公司2014年7月建立,B轮估值2亿美元,现在现已到了C轮融资阶段,投资者包括李开复立异工场、百度风投齐玉杰、中信工业基金、人工智能工业基金等等。

巧达的创始人成予曾经是百度第一任产品部担任人、联合创始人沈毅曾经是百度电子商务事业部技能总监和百度爱乐活技能副总裁。

公司曾声称经过整合多达2.2亿份自然人简历、100亿个用户辨认ID组合和1000亿+用户归纳数据,制作出了触及我国8亿人口的多维度数据。其间,包括个人隐私与非隐私信息。

此外,巧达科技还有超越10亿份通讯录,而且把握着与此相关的社会联系、组织联系、家庭联系数据。结合简历、通讯录,以及外部获取的超越千亿条其他用户数据,巧达科技自称具有超越8亿自然人的认知数据。

也便是说,超越57%的我国人的信息都在巧达科技的数据库里边。

“基本上一切你能数的上名的大型互联网公司,都是巧达科技的客户。”一位之前简历中介生意的从业者。

多个大数据公司因爬虫被查

最近的大数据工作,风声鹤唳。

在中秋节前一天,我国电信控股的子公司天翼征信传出风声,其总司理、副总司理以及商场人员被差人带走,原因是与其协作的大数据公司被警方查询。

在天翼之前,新颜科技CEO黄向前被警方带走、魔蝎科技公司CEO周江翔涉事被查、公信宝公司门口被贴了封条、闻名第三方数据服务公司聚信立宣告将暂停对外供给用户授权的运营商爬虫服务……

据内部消息,最近监管对数据乱象出手,开端整理举动,15家公司被列入查询名单,其间几家估值都超几十亿。

国内许多大数据公司的数据来历多多少少都有必定的问题,跟着我国本年6月1日起,《中华人民共和国网络安全法》将施行,一切的网上行为将越来越严厉,假如还依照之前的惯性去操作,迟早会出问题。

“技能中立论”价值巨大

不知道咱们是否发现,跟着国家经济的不断发展,曾经或许处于灰色阶段的工作,现在简直都渐渐不能做了。写这篇文章的意图,也是为了警示咱们技能是无罪的,可是用到了错的当地价值也是十分巨大的。

我之前看过这样一个报导,一个程序员由于喜好写了一个程序(侵略东西),而且把此程序上传到了互联网上,没想到过了两年之后,有人使用这个小程序不合法获利500多万。

尽管这名程序员并没有由于这个程序而获利,可是间接给违法人员供给了违法的东西,最终被判刑 2 年延期 2 年履行。

程序员的日子是简略的,作业大约也只关怀代码和BUG。小明也从来没有把自己的工作和违法联络在一起。

技能自身是不违法的,就好像一把水果刀,假如用来削苹果削梨没有任何问题,可是用来伤人便是凶器,就要被列入证据list。

爬虫也是如此,在大多数情况下,仅仅收集互联网上的揭露信息,很难说是违法行为。可是一旦触及侵略到别人体系去获取数据,那必定存在着法令危险。

或许许多同学是懵的,许多互联网公司便是靠抓取数据活着的。他仅仅正常履行公司组织的作业任务,怎样就涉嫌违法了呢?

这儿结合律师朋友给出的一些主张,这儿摘抄出来仅供参考。

单位违法和个人违法的联系

首要了解一下单位违法。除了自然人违法,还有单位违法,是指公司、企业、事业单位、机关、集体为单位获取利益,经单位决策机构或许担任人决议施行的,法令规则应当负刑事职责的损害社会的行为。

我国刑法对单位违法准则上采纳双罚准则,即单位违法的,对单位判处罚金,并对其直接担任的主管人员和其他直接职责人员判处刑罚。相关司法解释规则,在审理单位成心违法案子时,对其直接担任的主管人员和其他直接职责人员,可不区别主犯、从犯,依照其在单位违法中所起的效果判处刑罚。

因而,公司违法有或许会牵连职工,尤其是案子中对不合法获取数据有直接职责的爬虫工程师。这也是为什么当事人在公司人小言微但仍是被批捕的原因。

其次,是否能够“不知者不为罪”来辩解?刑法准则之一是法无明文规则不为罪,并没有“不知者不为罪”。片面上的歹意是衡量违法的要素之一,结合客观上的行为来推理片面歹意。破解别人的服务器,获取别人不揭露的信息,不能说没有歹意,不能以不懂法来搪塞。

什么样的爬虫违法?

假如爬虫程序收集到公民的名字、身份证件号码、通讯通讯联络方式、住址、账号密码、产业情况、行迹轨道等个人信息,并将之用于不合法途径的,则必定构成不合法获取公民个人信息的违法行为。

除此之外,依据相关规则,关于违背国家有关规则,向别人出售或许供给公民个人信息,情节严峻的,盗取或许以其他办法不合法获取公民个人信息的,均可构成成“侵略公民个人信息罪”,处三年以下有期徒刑或许拘役,并处或许单处罚金;情节特别严峻的,处三年以上七年以下有期徒刑,并处罚金。

要点重视:下列情况下,爬虫有或许违法,严峻的乃至构成违法。

爬虫程序躲避网站经营者设置的反爬虫办法或许破解服务器防抓取办法,不合法获取相关信息,情节严峻的,有或许构成“不合法获取计算机信息体系数据罪”。

爬虫程序搅扰被拜访的网站或体系正常运营,后果严峻的,冒犯刑法,构成“损坏计算机信息体系罪”

爬虫收集的信息归于公民个人信息的,有或许构成不合法获取公民个人信息的违法行为,情节严峻的,有或许构成“侵略公民个人信息罪”