新华社记者卧底骚扰电话源头企业竟爆出“百度推广”黑幕
新华社记者“卧底”骚扰电话源头企业,成千上万条含有个人姓名、住址、工作单位等详细信息在大量微信群内“裸晒”。报道中称,“这些公民个人信息主要来源于百度等一些知名互联网企业”。黑产公司称,在百度上“点开这些推广信息后,你个人信息就可能直接流入培训机构的数据池中。”
对此有业内人士对时间财经表示,多因广告推广企业,“在网页上加非法代码,获取用户信息”所致。百度方面也给到了时间财经回应,称”向他人出售或者提供公民个人信息属于法律禁止行为,百度坚决抵制这种行为,也绝不会开展此类业务。”
“仅2018年,百度累计下线“涉嫌窃取公民个人信息”的恶意网站达34万,网址达1490万,并配合公安打击数十个涉嫌用黑客手段制作“营销工具”的团伙,抓获相关犯罪嫌疑人近百人。”百度方面表示。
然而,黑产问题几乎难以杜绝。21世纪经济报道引用数据称,截至2018年6月,中国网络黑产从 业人员已超150万人,据估计造成的损失规模高达千亿元级别。据百度安全发布的《互联网安全报告:态势分析与生态治理》称,“隐私类黑产依旧顽固,攻防对抗尚处于博弈阶段。”
魔道相长
百度在安全上纰漏并不少见。譬如在2017年,便有第三方安全机构火绒安全实验室发布报告《百度旗下网站暗藏恶意代码 劫持用户电脑疯狂“收割”流量》,称经过截获、分析、追踪并验证,用户从百度旗下的skycn.net/和 soft.hao123.com/,两网站下载任何软件都会被植入恶意代码。
第二天,百度回应已经清除两个下载站中的相关恶意代码,并称系第三方外包团队开发,利用网络黑产,从百度联盟中分成.
百度搜索一直是百度的安全问题重灾区。2019年2月28日,自媒体“新闻实验室”一篇名为《在百度搜索部分小学和幼儿园,会被导向色情网站》引发关注。文章称,“在百度中搜索广州的很多小学和幼儿园的名字,结果中排在首位的一般都是百度百科,而进入百度百科页面之后,点击参考文献中的“广州上学网”,却会进入色情网站。”
对此,文章作者方可成分析称,“这些学校的百度百科页面在编写的时候,确实是指向了真正的“广州上学网”。后来,这个网站关闭了,内容无法再访问。再后来,“广州上学网”的域名被色情网站运营者买下,设置成了自动跳转色情网站。这样一来,所有原本指向“广州上学网”的链接,现在都会被跳转到色情网站。”
很快百度给出回应,称,“已经紧急删除了该词条中被不法分子利用的参考资料网页,开发团队即刻全面排查以该域名为参考资料的所有词条,并进行相应处理。”
对于后续的问题,百度声明“开发团队会持续针对所有词条的参考资料中网页的URL重定向问题进行全面排查,并集中处理。为了避免此类问题再次发生,百度百科将增加词条参考资料的检查频次,并丰富检查维度。”
“主要靠技术实时巡查,”据百度内部人士对时间财经介绍,解决这样的URL重定向的问题,“貌似目前AI用得不多。”
在搜索结果上,百度也给出了自己的解决方案。据百度安全称,比如在百度搜索“携程”,如下图所示有搜索结果会显示“官网”标识,这就证明通过了百度的官方认证,是该品牌的官方网站。同时,通过百度的实名实网认证,搜索结果还会展现V标。
时间财经发现,V标显示“暂未主动做出承诺保障”,据百度网民权益保障计划的说明,“商家如未履行相关承诺,百度注册用户可通过百度保障平台申请保障赔付。”
但需要注意的是,作为必需条件之一,“用户只有登录百度账号后,保障系统才能在一定周期内为用户保存点击记录,而点击记录是申请保障的重要证据之一。如未登陆百度账号,则点击行为无法被记录,从而无法申请百度保障。”
据百度安全8月9日发布的数据,在近半年,百度搜索就屏蔽了超过1200万个黑产引导词以及1.2亿个黑产相关链接。
内容负重
除了甄别搜索结果,百度自己生产的内容也给百度带了不小麻烦。这源于近些年百度在对待内容的态度上有了两个明显的转向。
一是加大自有内容的投入。二是视频内容的比重增加。但不变的是,因内容引起的纷争从未停息。
2018年12月,今日头条状告百度,称其经依法授权,享有所经营的悟空问答网上《天津菜是由鲁菜改良衍生出来的吗?》问题中作者回答一文的信息网络转播权以及相关维权的权利。百度公司“百家号”网站及“手机百度”APP上向公众提供了涉案作品的内容。
海淀法院一审认定,百度公司未经许可,传播相关文章的内容,侵犯了今日头条的信息网络传播权,需赔偿今日头条160元经济损失。引发纷争的百家号,不久又给百度带来了一场公关危机。
1月22日,同样由方可成撰写的文章称,百度搜索结果一半以上会指向百度自家产品,尤其是百家号,充斥着大量营销和质量低劣的内容,也导致百度搜索结果的内容质量大幅下滑。
1月23日,百度回应称,目前百度搜索结果中,百家号内容全站占比小于10%。还表示,现在的190万百家号创作者,覆盖了全部的权威媒体和咨询机构,也包含了大量优质的自媒体,他们在源源不断地贡献深度、权威的好内容。方再次回应称,搜索结果更重要的是首页内容占比,“全站占比没有说服力”。
随后百度对搜索结果做了微调,搜索内容展示中,不再包括网页网址,而是采用媒体的名称代替。也就是说很难判断来源是百家号,还是其他网站的内容。
百度十分看重内容。其新的呈现形式之一,信息流,已经同移动搜索、手机百度一道列为关键使命+主航道”。“主要是有流量,就有收益,百度信息流日均分发好几百亿,插条广告流量也是亿级曝光水平了。”在百度负责内容的人士对曾时间财经表示。
如何确保搜索结果和自产内容的安全,将庞大的信息围拢在自身的安全体系下?目前而言,百度还有相当长的路要走,无论是来自外部黑产还是自身策略。