Facebook推出图谱搜索:让一切信息可搜索化、可被

作者: 互联网资讯  发布:2019-10-22

幸福初体验

2011年12月初,扎克伯格向《连线》的记者展示了图谱搜索的早期样品,那时候它甚至还没有确定名字。当时 Facebook 已经搬到了位于门洛帕克的新家,那里也曾是 Sun Microsystems 公司的总部所在。记者在一间会议室中与扎克伯格、拉斯穆森和斯托吉会面,房间四周都是玻璃幕墙,和它在帕洛阿尔托总部的前辈一样,这间房子也被称为 “水族馆”(Aquarium)。会上,穿着标志性连帽衫的扎克伯格刚开始时还能保持坐态,不过说着说着,他就已经难捱心中的兴奋,在屋子里走来走去,时不时还踢一脚屋里的足球表示强调。

拉斯穆森在演示中输入“我家人的照片”,随后显示屏上立即出现了照片网格。他说:“对你来说,这可能只是一堆看起来傻乎乎的金发丹麦人。但对我而言,这却是一个精彩的体验。” 随后他又搜索了在纽约的好友,同样获得了一串列表。

图片 1
在斯托吉的Facebook中,“和我喜欢相同东西的人” 的搜索结果

扎克伯格说:“我喜欢搜索的东西之一就是工作信息,让我们来试试搜索哪些谷歌工程师同时有在 Facebook 工作的朋友。” 他输入这一问题之后自然就发现了不少符合这一标准的用户,同时每个人会附带一个矩形信息框,包含照片和关键信息概要,例如毕业学校、居住地点以及共同好友的姓名等等。“Facebook 就像一个巨大的数据库,而你在其中查找匹配的搜索结果,” 斯托吉说。

 “幸运的是在这些关系的终点总会存在一个人,” 扎克伯格说。“你总可以找到合适的人物或内容页面,然后就可以发送消息。”

拉斯穆森补充道: “假设我想在 Pinterest 找到一份工作——当然我并不是真想——并希望有人能帮我推荐,那么我就可以在自己的好友中搜索那些同时与 Pinterest 员工是好友的人。”

对于在线招聘网站 Monster 和职业社交网络 LinkedIn 来说,这些可都不是什么好消息。

斯托吉随后演示了一个约会交往请求——“住在我附近的单身女性”。于是一组年轻女性又出现在了屏幕上,不仅包括简短的个人信息,甚至还提供了交友或联系方式。“你可以再添加任何你喜欢的附加条件,例如是否喜欢某种音乐类型,” 斯托吉说。搜索结果甚至可以自动匹配搜索者的年龄,“我们正试图当一把红娘,促进美好姻缘的发生。”

然后他们又展示了这一产品样本的推荐功能。假设你将要造访一座从没去过的城市,就可以查查你的朋友们(或者朋友的朋友)在那儿都喜欢吃什么,还可以向那些自称美食达人或美食评论家的人寻求建议,甚至可以是那些美国烹饪学院的毕业生。你当然也可以随意搜索各种有趣的信息,例如喜欢米特·罗姆尼(Mit Romney)的人都喜欢看哪些书。换句话说, Facebook 不只帮助人们了解自己的朋友和家人,更帮助人们了解身边的广阔世界。咦?这不正是谷歌的目标吗。事实上人们每在 Facebook 上多查询一次信息,无论是寻找热门的餐馆,还是有品味的博物馆,抑或是最喜爱的音乐,就意味着谷歌上少了一次搜索。

几周后,《连线》记者终于可以用自己的账号亲身尝试这款产品,当那些搜索结果一个一个地显示出来时,总是能给人巨大的震撼。除了屏幕左边所展示的结果本身,屏幕右边还提供了密密麻麻的一串备选列表,帮助用户进一步提炼或调整搜索请求。图谱搜索团队称之为Power Bar,它能够将用户潜在的问题进行拟人化,这一能力简直令人恐惧。假设你要寻找尚未在 Facebook 上取得联系的大学老同学,紧接着 Power Bar 就可以帮助你进一步搜索与你同年毕业或毕业于相同专业的校友。根据动机的不同,你或许还可以将搜索条件限制为单身人士或开放人士。Facebook 早已为广告商提供了这种 “微观目标锁定” 功能——例如一名音乐会推广人员可以将广告投放对象限制为30岁以下,并且喜欢蓝草音乐的爱荷华州居民。现在,普通用户也可以使用同样的功能。

搜索结果本身也是根据搜索目的进行量身定制的。倘若 Facebook 认为你在查询招聘信息,它便会在结果页面中显示每个候选人的工作履历;倘若 Facebook 认为你在寻找炮友,那你就更有可能在结果页面中看到每个人的感情状态和所在位置。最重要的是,每条结果都会配有一个小的搜索按钮,这意味着你能够对特定的人、企业或是团体展开进一步的搜索,从而全面分析这个 “目标” 在 Facebook 上公开分享的信息。 

图片 2
在斯托吉的Facebook中,“好友在1999年以前的照片”的搜索结果

图谱搜索还允许用户探索有关于自己的信息。搜索团队里的一些成员经常使用“我喜欢的照片”这样的搜索请求,得到的结果便是一张生动的拼图,而其中每一块都是人生的精彩瞬间,内容可能包含有幸福的婚礼、难忘的毕业礼、美丽的日落、精心制作的资料照片或者热闹的聚会合影等等。“这是一种能促进幸福感的体验,”斯托吉说。

近日,谷歌(暂限于英文版谷歌)正式推出被称为知识图谱(Knowledge Graph)的新搜索功能。只要在谷歌搜索引擎里键入单词或短语,在传统搜索结果的右侧就会多出一个栏目直接显示该词条的相关信息,这些信息来自维基百科与其他提供信息服务的网站。与之前的浏览方式相比,用户免去了自己访问信息出处网站这一过程——谷歌直接把信息呈现在搜索页面中。

叛逃者的春天里的故事

现年 44 岁的拉尔斯·拉斯穆森(Lars Rasmussen)于 2010 年加入 Facebook,此前他曾供职于谷歌,也因此被认为是一名充满争议的叛逃者。这位丹麦工程师的职业生涯因两个重要项目而与众不同,其中一个获得了巨大成功,而另一个则遭遇了失败,传奇一般的失败。

成功的那个项目叫做谷歌地图(Google Maps),它原本属于一家小公司,拉斯穆森的哥哥在一次头脑风暴中想到了这个创意。2004 年,谷歌收购了这家公司,将其发展成为一个划时代的产品,几乎成为了人类数字生活的中心之一。它有多优秀?看看苹果决定不再将其作为默认手机地图应用时群众的反应就知道了。

而失败的那个项目叫 Google Wave,这是一个融合了电子邮件、即时通讯、协同办公以及富媒体共享等功能的复杂系统。拉斯穆森和他的团队成功说服谷歌向这一项目投入 2500 万美元和 60 名工程师,而 Google Wave 也在 2009 年谷歌开发者大会上正式发布。彼时拉斯穆森长达 80 分钟的演示赢得了观众的起立致敬,但谷歌仍于 2010 年放弃了 Google Wave ——它的定位不够明确,也无法赢得更多的用户。拉斯穆森随后表示,这是他 “人生中最痛苦的、最惊人的一次失败”。几个月之后,拉斯穆森离开谷歌,加入 Facebook。

2011 年的一个春天,正在和拉斯穆森一同散步的扎克伯格提到了图谱搜索这一设想并邀请他加入,一切从此开始了。

在与这位年轻老板一同散步的过程中,拉斯穆森又获得了一次机会。扎克伯格表示,Facebook 拥有的庞大结构化数据库提供了一个独一无二的平台,通过对它进行详细地有针对性地开发,Facebook 可以创造出一个完全不同的搜索引擎,带来梦幻般的价值。拉斯穆森当时表示同意。“我们可以创造出一个引人注目的新支柱产品。” 他回忆说。

于是拉斯穆森加入了 Facebook 当时的搜索团队。这家公司坐拥庞大的信息库,但一般用户却很难访问。我在纽约的好友有哪些?我的朋友们在读什么书?附近有人喜欢威尔克(Wilco)乐队吗?哪一家意大利餐厅最受人欢迎?这些都是 Facebook 的新产品将要回答的问题,但拉斯穆森的团队却面临一个艰难的选择:是专注于常见的大众问题,还是迎接更大的挑战,开发出一个更智能的搜索引擎,允许用户问 Facebook 任何问题。

那年夏天,拿着一份粗糙样品的拉斯穆森在 Facebook 当时的总部与扎克伯格会面。在演示中,这一原始的搜索产品只能回答预先设定好的问题。不过,拉斯穆森随后提出了一个更广阔、更有雄心的目标:让这一搜索引擎几乎能回答任何问题,例如 “显示 2010 年去加州时我和朋友的照片”。

扎克伯格说,当时他一看到样品就认为拉斯穆森的理念完全正确,但可能无法实现。扎克伯格回忆他当时的反应是: “绝不可能,随便输入想要的东西然后就能变魔术一样弹出一个包含相关内容的页面,这种事情不是通过自然语言所能实现的,更别说为所有这些内容编制索引了。在 Facebook 上有超过 1 万亿个用户关系,将这些关系索引化,还要随意利用它们,这绝对是一个巨大的技术挑战!”

尽管如此,扎克伯格彼时依然充满热情地表示,如果真的能在技术上实现,这将会是一个非常出色的产品。用硅谷的行话说,这种热情翻译过来就是 “你必须实现它”。

依旧是那个夏天,拉斯穆森的项目有了另一名同事——同样来自谷歌的汤姆·斯托吉(Tom Stocky),这位麻省理工学院的毕业生在 2005 年加入谷歌后参加过多个项目的工作。(醒目:Facebook 的搜索产品是由两名谷歌前员工领导的。)斯托吉曾是谷歌旅行搜索产品的主管,这使得他成为 Facebook 搜索团队的理想目标。斯托吉表示: “他们和我谈到了这个产品的愿景:让一切信息可搜索化、可被发现。”

那年夏天对于扎克伯格、拉斯穆森和斯托吉来说无疑是美好的。

此后的1年多时间里,拉斯穆森和斯托吉每周五中午都会与扎克伯格会面,向他报告项目进度。最终有50名工程师参加到了这一项目中,还包括两名语言学家,他们负责帮助搜索引擎更好地理解人类提出的问题。

不过随着这一搜索产品的轮廓逐渐清晰起来,很明显,它要求 Facebook 本身也进行一次彻底的改头换面。为了鼓励用户把问题说得更详细,Facebook 将搜索栏做得更大,基本上就成了页面顶部的一块蓝色宽横幅,各种各样的图标也被挤到了边缘。更引人侧目的是,主页上 Facebook 公司的名称都被撤下,代之以一个精心设计的 “F” 字母。换言之,图谱搜索的重要性已经比肩公司的名字本身。搜索团队的一位产品经理基思·佩里斯(Keith Peiris)表示: “当我刚刚加入这个团队时,我有点怀疑搜索服务是否真能成为 Facebook 在未来的重要部分。但我们很快意识到,这一切是不可避免的,并且终将使 Facebook 更强大。”

更大的调整在于让用户理解图谱搜索的一些规则与传统的网页搜索完全不同,拉斯穆森团队的一部分工作就是对用户进行 “再教育”。好的网页搜索能仅凭几个相对模糊的关键词就得出结果,而图谱搜索则恰恰相反,只有搜索请求越详细、越复杂,图谱搜索才能更好地工作。为了梳理出那些更复杂的搜索请求,Facebook 会预测用户想要搜索的信息,这类似于谷歌搜索的关键词自动补足功能。例如在输入 “纽约” 之后,图谱搜索会询问用户是否要搜索“来自纽约的好友”、“人们在纽约常去的饭店” 或 “纽约人喜欢的东西” 等等。搜索请求越复杂,得出的结果就越精确。如果你输入 “我那些喜欢 Homeland 餐厅的好友在旧金山常去哪些饭店”,那么你极有可能得到一个有效的答案。佩里斯表示: “我们真心希望用户能忘掉以往使用搜索引擎的方式,那种随便输入3个非常模糊的关键词的手法现在已经不好用了。事实上,他们需要准确地表达出他们希望获得什么信息。”

现在,轮到 Facebook 来看看用户的反应到底如何了。拉斯穆森表示他也不清楚未来将会发生什么,尤其是在经历了谷歌地图和 Google Wave 带来的大喜大悲之后。他说: “我曾因谷歌地图而如坐针毡,却从未因 Google Wave 感到紧张。因此,我觉得这是不错的预兆。”

行业冲击与信息垄断

回到谷歌知识图谱对互联网产业的冲击这一话题。知识图谱功能确实损害了信息来源网站的利益,谷歌正在把网络上的信息一步步地搬到自己的数据库中(正如它已经对维基百科进行的侵蚀与同化),用户们逐渐不用再点击信息来源网站进行访问。而点击量对于网站而言意味着价值,维基百科依赖着用户的使用才获取了关注及捐款。点击量的下降必将导致网站提供信息量的下降,这种上层建筑侵蚀下层基础结构的不稳定性不用多说。如同触尾即毙的贪吃蛇,问题迟早会浮出水面。

谷歌对于这个质疑也给出了自己的回答,谷歌搜索业务的高管艾米特·辛格尔(Amit Singhal)对此话题给出了回应。他指出,搜索引擎的技术进步将扩大使用搜索引擎的总人数,而扩大的用户基数将给网站带去更多的访问量。辛格尔回避了这样一个事实:谷歌此次的新功能与他所言及的技术进步不同。之前谷歌在搜索引擎上所做的努力在于如何将搜索结果定位到更加满足用户需求的网站,而现在他们改变了用户习惯——用户不用再去访问网站了。所以无论这个基数有多大,网站方都不会看到自己想要看到的结果。

辛格尔还回应道,网站方与其指责搜索引擎的进步,倒不如在自己身上下工夫,提升自己的价值,而不是只回答搜索引擎就能搞定的问题。在他举出的例子里,这个“搜索引擎就能回答的问题”是“2加2等于几”。很明显,谷歌和辛格尔都没有在严肃地对待这个问题。至今没有人能够指出谷歌的边界在哪里,也许只有技术瓶颈能够成为他们的障碍。不过这倒是给整个互联网行业提了个醒——只要能提升自己的服务、为自己创造价值,谷歌绝不手软。

图片 3

用谷歌搜索“全球变暖”,右栏出现的是一个支持者和一个反对者。

假设谷歌的知识图谱完全成熟,它将涵盖地球上所有书籍以及网站上的内容信息。也就是说,它将具备信息垄断的能力。届时假设有一个网站对于“气候变化”和“知识产权”这样颇具争论性的问题拥有一个不同于常的论点,此时用户们使用谷歌的搜索引擎就无法找到它。历史经验无数次告诉我们,一旦有机构能够代表权威,它就有能力扼住信息的咽喉。

令人担心的是,谷歌把自己定位为信息的权威方,而不是一个互联网信息搬运工的角色。同时,它仅仅把这种权威的身份赋予自己——只有谷歌有能力对知识图谱上的内容进行判断和修改。老牌语义搜索引擎维基百科对自己的定义是“自由的百科全书”,主张“动态、可自由访问和编辑”的理念。但谷歌不是这么想的,它把这扇门向公众关闭了。

 


 

文章编译自Extreamtech网站: Google’s Knowledge Graph: Wikipedia on steroids, or the beginning of the end for the web?

作者: David Cardinal

隐私的噩梦?

但对有些人来说,图谱搜索或许是一款带来恐惧感的产品。尤其那些已经对 Facebook 不端正的隐私行为忧心忡忡的人,绝不希望在别人搜索“我附近的单身女人”这种问题时,得到的结果里出现了自己的个人信息。早在 2011 年,美国联邦贸易委员会(FTC)就曾起诉Facebook,认为他们在隐私问题上欺骗了用户,因为 Facebook 没能保证用户的个人信息不会公开。后来双方达成和解,而 Facebook 也承诺在今后的 20 年内接受定期的隐私审计。

对此,Facebook 的一名产品主管山姆·莱辛(Sam Lessin)表示,公司已经意识到这种隐患,同时也已经启动了一种更加易用的隐私设置方式来避免用户 “曝光”。他强调图谱搜索尊重用户施加的所有隐私限制。“图谱搜索中提供的所有信息,其实早就已经在 Facebook 上以其他方式公开过了,” 他说。从这个角度来看,图谱搜索与 NewsFeed 颇为类似——后者并没有曝光任何新信息,也没有违反用户施加的任何限制,它只是提高了已公开信息的曝光率和曝光时间而已。

他还指出,Facebook 的领导层虽然坚信分享必将带来好处,但也会坚决维护用户的利益,让他们知道哪些人会看到自己的信息,从而让他们处于安心的状态。“如果你不知道分享的对象是谁,你就不会分享太多信息,” 莱辛说,“所以在这件事上,混乱不清的状态对所有人都没有好处。”

不过有些问题似乎会很有趣:一旦人们知道他们在 Facebook 上分享的照片、兴趣爱好和详细个人信息是如何转化为一款新产品的,一旦他们又知道这款产品将会使那些数据被更多的人看到,甚至一些原本毫无关系的人也会因此而看到那些数据,他们会作何反应?这款产品会鼓励人们分享更多信息,进而更广泛的表达自己,甚至怂恿他们建立新关系的欲望?还是会导致他们降低分享的数量,提高隐私等级,从而避免一双陌生眼睛的窥探?“愿意主动曝光和不愿曝光的用户之间可能出现分化,”Facebook 沟通与公共政策副总裁埃利奥特·施瑞格(Elliot Schrage)预测说,他还指出 Facebook 将把选择权交给用户, “我们期待看到最终的百分比和人口统计学数据,那必将是非常有趣的。”

由于认识到图谱搜索未来可能产生令人担忧的状况,Facebook 早已未雨绸缪,它计划放慢推广脚步的策略来让用户逐步意识到这项功能的存在。“我们花了相当大的力气来向用户传达这项功能的实际作用,” 莱辛说, “理论上来说,这样大力气的宣传已经足够用户全面的理解产品了。但只有当用户亲眼看到、亲身尝试这项功能之后,我们才能知道他们到底会对它作何理解、有何反应。”

Facebook 的时间非常充裕,他们计划在未来几年内将搜索业务逐步扩展为公司的关键部分,而这次推出的图谱搜索只是起步而已。“现在还早,” 扎克伯格说,“很显然,我们还有许多重要的东西没有加到这个最先发布的版本中。” 其中最扎眼的一点是,图谱搜索发布初期只支持英语。(但扎克伯格也指出,45%的Facebook用户能看懂英语。)

不过,目前堪称 Facebook 中最关键的两项内容:分享 Post 和状态更新都还没有被编入索引中。因为纳入它们需要复杂的技术支持,还会耗费巨大的资源,不过 Facebook 已经开始着手攻克这一难关。另一项被 Facebook 提上议事日程的是融合第三方应用产生的海量数据。例如,用户可以使用音乐应用 Spotify 来看看好友中有谁沉醉于劳拉·奈罗(Laura Nyro)的歌声;或者利用一款健身应用来寻找与你路线相同、速度相当的慢跑搭档。

除此之外,现在的图谱搜索还缺少另外一个重要元素:广告。但这一情况不会持续太久,毕竟搜索广告才是互联网的终极利润来源。斯托吉称目前 Facebook 搜索产品的主要关注对象是用户,但他也承认今后很可能会服务于广告商。“Facebook 现在的用户体验有些被动,”他说。“图谱搜索可以让用户询问具体的问题,也可以让他们表达心中的意愿,那么广告主肯定也希望根据这种意愿精准定位广告对象。这就是搜索广告的价值所在。”

据扎克伯格称,Facebook 不久后还将在移动应用中整合搜索功能。虽然他并未透露任何产品细节,但可以轻易预测手机版图谱搜索将新增一个重要元素:位置。(例如在你进入一家酒吧前就能了解里面是否有与你年龄相仿,但却单身一人的迷人异性,而他/她又是否与你有共同好友或者喜欢看同一部电影。)扎克伯格对加入语音搜索功能(就像 Siri 那样)也持开放态度,并且准备推动图谱搜索团队开发出一套通知系统——你可以事先设定各种限制条件,一旦附近有人符合这些条件,Facebook 便可自动向你发送提醒。

与坦承自己如坐针毡的拉斯穆森不同,扎克伯格的自信溢于言表。当记者问他是否想过有一天 Facebook 的单日搜索量会与谷歌这样的专业搜索引擎相当时,他也毫不谦虚。“假以时日,我希望能够实现,”他说。“但我们开发这项功能的初衷是我们认为用户想要这样的功能,而这项功能目前还有很多不完善的地方。但我认为,即使是在初期它的用户体验也将非常出色,人们会说:‘擦,碉堡了!’”

 

编译自:   《连线》,Facebook’s Bold, Compelling and Scary Engine of
                   Discovery: The Inside Story of Graph Search​

文章图片:wired.com;(小图)kunocreative.com

技术进步

知识图谱仅作为一项新功能,就已经收录了约5亿个词条,信息量也已达到35亿条,而且这个数据还在不断地膨胀。对于一个语义搜索引擎而言它的确足够强大,老牌语义搜索引擎维基百科只有3000万个页面,相比于谷歌足足少了一位数。功能推出后的谷歌搜索搜索结果分为左右两个部分,左侧是传统的搜索结果,右侧是知识图谱功能提供的语义信息。

图片 4

谷歌搜索布朗克斯动物园,在右侧会出现动物园的相关信息

上图为对美国布朗克斯动物园(Bronx Zoo)的搜索结果。在搜索结果新增的右侧,谷歌给出了一张布朗克斯动物园的地理位置图,地图下方是对动物园的基本描述。描述的右下角标注了维基百科的链接,表示此条信息选取自维基百科。在基本描述之外谷歌还列出了布朗克斯动物园的一些玩点与看点。与传统搜索结果中的第一条——动物园官方网站相比,这些信息还是略显单薄。但对于那些没有官方网站的词条而言,这样的信息应该算是很具参考价值的了。

本文由金沙澳门官网dkk发布于互联网资讯,转载请注明出处:Facebook推出图谱搜索:让一切信息可搜索化、可被

关键词: