百度谷歌都作恶,但到底哪家技术更厉害?
创意、流程、执行缺一不可
DEVELOPMENT COMES FROM SERVICE

当前位置:首页>新闻资讯>行业新闻

百度谷歌都作恶,但到底哪家技术更厉害?
发布时间:2018-08-19     关键词:百度谷歌      点击量:1649

AI 前线导读: 前几日,人民日报在推特和 Facebook 上发布欢迎谷歌回归的消息,并强调前提是要遵守中国的法律。耐人寻味的是,这两个平台上的消息没多久就全部删除。

根据外媒 The Intercept 的消息,谷歌搜索极有可能是通过与中国企业“合作”的方式回归中国。据知情人士透露,谷歌内部已经完成了一个可以通过中国政府审查的“阉割版”搜索引擎,内部项目代号“Dragonfly”。

虽然不知道这次谷歌回归是否能成真,但在随之而来的谷歌百度之争中,大部分网友已经出现了对谷歌“一边倒”的支持。诚然,百度一直以来故事与“事故”颇多而饱受批评,但作为很多人心中的“白月光”,谷歌其实也做过不少糟心事。

 

01

都在骂百度,那是你们忘了谷歌的恶

 

如果你是网络老鸟,相信你还记得谷歌退出中国前给中国网民留下深刻不良印象的那件事儿。

 

简单回顾一下:2010 年初,有用户在谷歌自定义界面上的“搜索热词榜”上,看到了排名**的热词竟然是“Chinese people eating babies”,意为:中国人吃婴儿。

 

现在大家可能会会心一笑:嗨,不就是个梗吗。但是在当时,这件事可是引发了轩然大波。只要搜索“中国人”就会出现“吃婴儿”的头条消息,仿佛是个中国人就会吃婴儿一样,简直可以认为是恶意抹黑了。美籍华人维权社团从 2009 年开始就这一事件投诉谷歌,一直到 2016 年,谷歌方面才回复律师,词条得以删除。

 

还记得谷歌曾经的口号是“不作恶”,这样看来,种族歧视似乎不在谷歌的“作恶辞典”之中?

 

百度在几年前因“魏则西事件”受到了网友的强烈谴责与抵制,还因此牵出一堆违规经营的“莆田系”医院,之后百度承诺要对搜索引擎进行整改,但仍然有眼尖的网友发现搜索的结果中“偶尔”会冒出一些莫名其妙的广告。

 

有人会说百度是自讨苦吃,触碰了危险的底线:医疗,哪知道谷歌又何尝不是在医药行业赚到过盆满钵满。

 

早在 2003 年,谷歌就因为网络药品广告问题接到美国国会三个不同委员会的调查质询。2004 年 7 月,就在谷歌上市前一个月,由于美国参议员计划通过两项监管网络药店的法案,谷歌负责全球网络广告的副总裁谢莉尔·桑德伯格 (SherylSandberg) 还赶赴首都华盛顿就这一问题作证。

 

但随后发生的系列负面事件显示,尽管谷歌高层早就意识 到非法药品广告的问题,但这家全球**搜索引擎依然会不时卷入负面消息。

 

2009 年爆出的大卫·惠特克 (David Whitaker) 事件则让谷歌在这一问题上首次形象扫地,也让谷歌真正意识到虚假网络广告的危害以及搜索引擎对公众的责任感。同样在那一年,百度也被曝出过虚假医疗广告事件。

 

AI 前线注:2006 年,因为金融欺诈等罪名数次入狱的惠特克从美国偷渡到墨西哥,做起了开网店卖假药的生意。惠特克把纯净水贴上类固醇的标签,通过谷歌 AdWords 打广告,以每瓶 1000 美元的价格从墨西哥卖给美国顾客。2008 年,惠特克被遣送回美国。他对美国司法部供述称谷歌的客服在明知他的“药品”不符合美国法律的情况下,主动指导他避开谷歌的审查机制,在网上投放假药广告。

 

 

2011 年 8 月,就在谷歌宣布收购摩托罗拉移动的那个月,谷歌与美国司法部就非法网络药店广告一事达成和解,谷歌为此支付了当时企业高额的企业罚金——5 亿美元。

 

经历过一些事情,才能意识到什么是正确的路线,个人成长如此,对一家公司来说更是这样。两家搜索引擎在各种各样的风浪中不断前进着,虽然偶有互相超越,但总体态势是向上的。可是,对于用户来说,这些负面事件深深地刻进了他们的心里,这样的搜索引擎,有些人表示再也不敢相信了。

 

02

搜索技术哪家好?看**怎么说

 

百度与谷歌都曾作过“恶”,人们似乎很容易用这些事情作为评判的标杆,按你胃(anyway),不管你想从什么角度来评价这两家公司的好坏,那是你的自由,我们的任务是从技术层面上来告诉各位读者如何来评判他们的区别。

 

2006 年,有人做过这样的比较。

 

 

上图是 2007 年有人做过的百度和谷歌用户眼球追踪的对比图。简单来说,图上绿色的点就是用户眼球浏览的记录,从上图能够看出:百度用户虽然很高的几率下能够在**条结果就得到自己想要的答案,但是浏览整个页面的概率远高于谷歌。

 

十年前的比较,似乎谷歌在搜索结果的精准度上略胜百度一筹,但是十年过去了,事情还是这样的吗?

 

近几日,一组百度和谷歌的搜索结果对比图又火了。

 

 

同样的词汇,在谷歌搜图上找到的就是雪白的场景或者颜色,而百度出现的确实各种不可描述(已打码),虽然经过 AI 前线编辑的实测发现百度并没有出现上述情况,不知道是因为“求生欲”还是其他原因。

 

但是,仅仅因为同一词语搜出不同结果就判定搜索引擎的好坏未免太过武断。AI 前线因此采访到了一些技术**,请他们来帮忙解答一下:怎样评价搜索引擎的好坏?

 

微博计算机大 V龙星镖局 告诉我们:从技术角度来讲,有一系列专业的做法去比较两个不同搜索产品的各方面指标,如召回率,准确率,多样性,停留时间等等,业界也有一些第三方机构、学术研究机构会做专业的评测,可以参考。

 

但要注意的是,搜索结果质量的评测是个值得好好讨论的问题:一方面抽样的 query 是否足够多,代表了大部分用户的需求;另一方面,相关性并不完全是一个可以说得清楚的标准,而且可能部分是因人而异的标准。如果有机构想从事评测这方面的工作,个人觉得利用“众包”方式来解决以上两个问题是值得尝试的。

 

对于谷歌和百度两家搜索引擎的排序系统,他认为从公开可见的技术方案来看差异不大,但也不排除有些核心机密没有公开出来。但他认为 技术方案上的大差异不足以造成两家明显的不同,更多是产品、运营甚至公司文化上的差异。

 

他进而补充道:“另外我特别想说的一点是,用户使用行为对搜索排序影响非常大,技术方案的先进性更多体现在猜用户的意图,拟合用户的习惯。

 

据我了解,在中国,百度和谷歌的核心用户是有天然差异的,这就可能造成即使同样的技术方案,排出来的东西也是有差异的。”

 

而接受 AI 前线采访的另一位来自达观数据的**则表示:搜索引擎受语言种类的影响很大,谷歌作为覆盖全球各类语种的搜索引擎,在索引库的大小方面有天然的优势,因此在搜索英文或其它非中文内容时效果比百度明显领先。在中文搜索领域,百度和谷歌的系统对文字语义理解的方式也各不相同,因此结果也一定存在差异。

 

另外,达观技术**认为,需要特别指出的是:搜索引擎给出的结果,是由两部分合并组成的,一部分是从网页库中搜出的自然结果,另一部分是从广告库中匹配出的广告。

 

搜索引擎会把这两部分的结果合并在一起后终呈现给用户。搜索引擎的主要利润来自后者,因此广告匹配技术的取舍非常重要,需要在保护好用户体验和赢得商业收入方面尽可能做好平衡。百度之前引起很大争议的地方主要也是在这里。理想的方式是通过更精准优质的广告匹配技术,让用户真正认可搜出的结果,帮客户找到所需的信息。

 

有不少人认为:在中国环境和中文条件下,中国人研发的本土化搜索引擎或许更好用。对于这个观点,达观数据的**认为:中文自然语言理解有很多独特的地方,中国人当然应该更懂怎样让计算机系统更好地解读中文背后的含义,也更理解中文网民的搜索意图。另外中国网民巨大的用量和积累的海量行为数据对训练出更优质的搜索系统也大有裨益。

 

他补充道:“虽然我们欢迎国际巨头积极参与市场竞争,促进行业健康发展,但也同样期待核心技术能掌握在中国人手上。”

 

后,我们再回过头来聊聊搜索结果的问题。

 

上文中,我们提到:不同的用户搜索出来的结果可能不同。对此,达观数据的**告诉我们:根据用户的过往浏览行为实现“千人千面”的个性化结果是几乎所有搜索引擎都在使用的技术。

 

龙星镖局则进一步告诉我们:目前 各家搜索引擎都不同程度地考虑了个性化因素,搜出来的结果是受非个性化和个性化两方面共同作用的。在确定性 query 上,个性化策略起的作用有限。但不确定性 query 上,个性化策略可能造成肉眼可见的差异。但无论如何,做不做个性化,个性化因素影响多少都不关键,关键的还是为用户服务,找出来用户更想要的内容。

 

到此我们简单总结一下上述大 V **们的发言:

 

由于搜索引擎的个性化技术,导致了搜索结果的差异;

谷歌和百度各有各的技术专长,百度在中文搜索更胜一筹,谷歌则强在英文结果;

如何评价搜索引擎的好坏是很复杂的问题,仅凭搜索结果来下结论不是很严谨。

 

03

就算回来,谷歌还会是老大吗?

 

8 月 6 日,人民日报在推特、Facebook 等海外社交平台上发文,欢迎谷歌回归中国,但是前提是要遵守中国的法律。随后还附上了一篇名为《稳定是中国互联网开放的前提》的文章链接。

 

文章提到:谷歌当初离开中国的选择是一个失误,这八年来中国互联网的发展十分迅猛,我们十分欢迎谷歌回归,但守法是前提。

 

正如这篇文章提到的,在谷歌离开中国大陆的这 8 年时间里,除了互联网,谷歌的老对手百度也在不断发展,李彦宏对此事也在朋友圈中进行了回复:2010 年,百度在国内的市场份额已占到 70%。

 

而现在,2018 年,百度所占的市场份额应该更高了。

 

从搜索引擎的使用人群来看,热衷于使用谷歌的大都是技术从业者,或者是学生群体。这些人会使用一些“科学上网”工具,同时由于谷歌搜索结果里英文资料比较丰富,所以这一群体偏好谷歌更多。

 

图片内容来自微博

 

通过对一些技术人的采访,我们总结出了技术人对百度和谷歌的三种态度:

 

1 两款搜索引擎当年都用过,百度当时确实对中文搜索体验比谷歌好很多,一个“你可能还要找” 功能就已经强出太多了,这么多年过去了,百度的优势只会更大。

 

2 不用非此即彼,两个一起用没有一点毛病,事实上现在我也是同时用百度/必应/谷歌。现在喊谷歌喊得凶的未必将来是真用谷歌的。

 

3 对于学术狗来说,谷歌回归是大好事。

 

其实,对于国内的非研究或学术的一般用户来说,百度其实也是够用的,查一些中文资料,百度完全没有问题。而这一类人群占到了百度用户的大多数,他们当中有的或许完全没用过甚至不知道其它搜索引擎的存在,这一类群体也给百度带来了不小的市场。

 

但是,对于百度来说,谷歌这个对手的武器可不止搜索引擎这一项。

 

谷歌翻译曾经被人诟病为“灵魂翻译”,结果总是驴唇不对马嘴,但是加入神经网络的谷歌翻译现在可谓是智能翻译界的标杆产品,短篇文章翻译几乎不用人工校对。

 

此外,谷歌知名的深度学习框架 TensorFlow 已经占有了巨大的市场份额,百度出品的 paddlepaddle 想要赶超似乎有些困难。

 

与此同时,李飞飞、Jeff Dean 频繁来到中国,在深圳、北京等地开展宣讲会,与清华等知名高校的学生接触,似乎也在不断放出信号,人才资源的争夺对百度来说也是一份压力。

 

不过,对于百度来说,这份压力或许是一件好事儿,大 V 龙星镖局认为:首先肯定是欢迎谷歌回归中国,服务中国用户。不过,目前我只看到要回归的消息,但具体什么时候回归,哪些产品回归,以什么样的方式回归都还没有定论。但我始终认为抛开政治因素,谷歌迟早会重新捡起中国市场的,因为这里的商业利益太大了。

 

能否威胁到百度的地位不太好说,这个关键点要看能多大程度上夺得中国用户的芳心。如果只是回归中文搜索的话,个人认为比较难。百度的强大不止在于搜索,更在于围绕搜索建立的周边生态,如贴吧、知道、地图、音乐、视频等都是很好的护城河。

 

达观数据的**也表示:从用户的角度来看,一个存在竞争的市场是健康和有益的,也能够推动整个搜索行业的技术和体验以更快速度前进。谷歌如果回归,一定会在短时间内抢占一块可观的市场份额,长期来看,则会起到“鲶鱼效应”,扰动中国搜索市场往更健康的方向发展。

 

百度曾经有过不好,但是作为国内用户,虽然嘴上说着一万个不好用,但是心里还是希望它能更好,只是这样的希望真的经不起三番五次的消耗,问题当然会出现,但正视问题,并积极处理问题才是关键。

 

而对于谷歌,虽然好用,但真的回归之后,我们迎来的是否会是一个经过修剪、“阉割”的,不完整的谷歌呢?答案几乎是必然的。

 

后,用达观数据的**在采访中的一段话作结:

 

搜索广告本身并没有错,因为如果广告内容就是能满足用户的需求,那是两全其美的好事情。但是如果为了追求更高的广告收益,而放松对所出广告结果的管控,通过虚假方式骗取用户对广告的点击,这就伤害用户对搜索引擎的信任了。我们都希望掌握着巨大流量的搜索引擎,能扮演好到客观公正的“知识领路人”的角色,而不是利益驱动的带路党。

CONTACT US
  • 咨询热线:0517-89892800 / 138-6167-2014
  • 公司地址:宿迁软件园1号楼506室
  • 电子邮箱:hsw@haxh.net
扫一扫二维码关注我们