Facebook如何使用“我们”的数据去构建人工智能_机房360

摘要：是时候停止把Facebook当作纯粹的社交媒体公司来看了。它用无人机提供互联网服务，为了发展虚拟现实而收购Oculus，不懈追求人工智能，Facebook已经迅速成为世界上最先进的技术研究中心之一了。

　　无独有偶，谷歌甚至IBM之类的公司也有类似的计划，总的来说，人工智能领域的发展已经提速到无疑会影响到人机交互的节点了。事实上，这已经发生了，不过是悄悄地在幕后进行。每月为15亿用户提供服务的Facebook对人工智能技术兴趣浓厚。Facebook解决的是模拟一般智力的问题——即让计算机日渐脱离线性逻辑的机器的思考方式，而是像我们自由形态的人类以多管齐下的方式来思考。Facebook人工智能研究室(FAIR)致力于解决广义的人工智能的问题，而语言技术项目组和Facebook M(虚拟助手)这类规模稍小的项目组则致力于开发用户操作中会用到的实际功能。

　　Facebook人工智能研究室的诞生

　　一切始于2013年，Facebook创始人兼CEO Mark Zuckerberg、CTO Mike Schroepfer和其他公司高层在评估公司上线十年以来的成就，并思考在接下来的十年、二十年如何长盛不衰。

　　Facebook已经将机器学习运用到其流行的社交网络中，比如说决定用户会在News Feeds中看到什么内容。不过相比起当时前沿的神经网络成果，这不过是小儿科。

　　一些Facebook工程师也一直在尝试积卷神经网络(CNNs)，这是一种非常强大的机器学习，现在普遍被用于图像识别。即便人工智能还处于发展初期，Zuckerberg对它的潜力非常看好，因此他从谷歌大脑(Google Brain)挖了一位叫做Marc Aurelio Ranzato的工程师。然后他追本溯源找到了积卷神经网络的发明者——Yann LeCun。

　　Facebook人工智能实验室负责人Yann LeCun是人工智能界的一个传奇。他最早在1988年在贝尔实验室担任研究员(由电话之父Alexander Graham Bell创立，并因其在电信技术领域的无数领域的实验而闻名)开始他的研究，然后在AT&T实验室担任部门主管直到2003年。那之后他开始在纽约大学任教。现代的卷积神经网络是 LeCun职业生涯的巅峰之作。你是否曾经好奇过ATM怎么能识别你的支票?这就得益于 LeCun负责的「SN」的神经网路模拟器的早期研究，于1996年被采用。

　　「我开始和Schroepfer 和Mark接洽，我想他们也许喜欢我向他们讲述的东西」，LeCun在接受《Popular Science》采访中说道：「他们试图说服我来运作这个实验室……当像Mark 那样的人跑过来和你说：『好吧，你基本上接受了全权委托。你能组建世界一流的研究室，我希望你建立起全世界最好的人工智能研究实验室』。我的回答将会是：『嗯，相当有意思的挑战。』」

　　关于世界顶级的研究室是什么样子，Yann有自己的想法。如果你想要吸引顶尖人才，你得有一个雄心勃勃的研究室，有着雄心勃勃的长期目标。然后你还得给他们工作上的自由权，同时对你的研究你必须持有非常开放的态度。「这和Facebook的信念有几分吻合，Facebook秉持着开放的理念。」LeCun说。

　　组建团队

　　这个肩负着Facebook的未来的团队规模很小，由大约 30个研究科学家和15名工程师组成。团队有三个分支：Facebook人工智能研究组的主要办公室位于纽约市的Astor Place，由LeCun管理着一个由20名工程师和研究人员组成的团队。Menlo Park的是一个同等规模的分支。六月，FAIR又在巴黎设立了一个更小的5人组，与INRIA(法国计算机科学与自动化研究机构)合作。还有很多在Facebook其他部门一起合作致力于人工智能发展的团队，例如语言技术团队;FAIR只是主要的研究部门。

　　这些研究人员和工程师来自科技领域的各个层面，同时当中很多人都曾与Lecun合作过。高等级的人工智能研究并非是一个庞大的领域，而且Lecun的很多学生都创建了人工智能方面的初创公司，它们一般会被像Twitter这样更大的企业收购。

　　Lecun曾经告诉《连线》杂志，「深度学习实际上是Geofff Hinton，我，还有蒙特利尔大学的Yoshua Bengio之间的一个阴谋。」 Hinton在谷歌研发人工智能， Bengio奔波于蒙特利尔大学和数据挖掘公司Apstat之间，而LeCun也与其他行业内的著名企业有千丝万缕的关联。

　　「当我第一次在贝尔实验室做到部门主管时，我的老板对我说，你需要记住两点：首先，永远不要让自己陷入团队内部的竞争。第二，只雇佣那些比你更聪明的人，」LeCun说。

　　负责领导语言研究子群的Leon Bottou，是LeCun的一个老同事。他们一同研发了神经网络模拟器，1987年的AmigaOS就是他们的第一个作品。Bottou 2015年3月加入的FAIR，此前他在为微软研究组工作的同时，还致力于机器学习和机器推理的探索。

　　2014年11月，LeCun请来 Vladimir Vapnik作为他们的团队顾问。Vapnik和LeCun曾一起在贝尔实验室工作，发表了关于机器学习的形成性研究，其中包括一项测量机器学习能力的技术。Vapnik是统计学习理论之父，统计学习理论即基于既定数据的预测。预测，对人类来说似乎是一个简单的任务，实际上却需要关于预先形成的概念和对世界的观察的海量信息(更多是后者)。Vapnik，这一领域的先驱，基于他在知识传播上的兴趣，继续着这一领域的工作，并把师生互动时的线索运用在机器学习当中。

　　目标

　　团队的规模和科研力量允许Facebook拥有雄心勃勃的长期目标，绝不会达不到被LeCun称为「明确的智慧」的标准。

　　「迄今，最好的人工智能系统也是愚钝的，因为它们没有常识。」LeCun说道。他用一种情况举例，比如我拿起一个瓶子，然后离开房间。(我们在纽约Facebook的会议室里讨论真正的机器智能的诞生，而这个房间的名字却不怎么吉利—— Gozer the Gozerian，与《捉鬼敢死队》里面的反派同名。)人类的大脑不难想象出一个人拿起瓶子然后离开房间这么个简单的场景，但对一台机器来说，仅这个前提就会导致大量的信息缺失。

　　Yann一边说，我一边在心中想象这个场景：「你很可能站起来，即使我在语句中没有提到，你也很可能走动;你打开门，走进去，也许还会关上门;瓶子不在房间里。由于知道真实世界的情况和界限，你可以借由判断。因此我并不需要告诉你所有的细节。」

　　现在对于机器如何学习该水平的推理，人工智能领域的专家知道得并不多。在向这个目标迈进途中，Facebook正致力于制造能足够好地学习已知世界的机器。

　　LeCun说：「最大的障碍是自助式学习(unsupervised learning)。」现在机器主要通过一两种方式进行学习，即他助式学习(supervised learning)——在系统中，向机器展示成千上万的狗的图片，直到机器了解了狗的特征。谷歌的DeepDream以研究者反转流程以揭示出其有效性对这一方法进行了阐释。

　　另一种方式是增强学习(reinforcement learning)，即机器对给出的信息以是或否的二择一的方式进行选择，以给出一个答案。这种学习耗费的时间稍长，但是机器被强制由自身做出内在的抉择。当这两种学习方式结合起来时，就会产生强大结果。(还记得DeepMind Atari吗)。自助式学习不需要反馈或者输入，LeCun表示这就是人类的学习方式。我们发现、得出结论，并将其加入到人类的知识库存之中。这，被证明是一项艰巨的任务。

　　LeCun笑着说：「我们甚至没有一个用以发展人工智能的基本指导原则，很明显，我们在努力寻找。我们有很多点子，只是目前没一个奏效罢了。」

　　真正人工智能的早期探索

　　但是这并不是说以前的探索没有成果。现在让LeCun激动的是关于」记忆网络」的工作，其可以被整合进积卷神经网络，并使它们获得记忆保持的能力。LeCun把这个新的记忆模型比作大脑中的分别由海马体和大脑皮层控制的短期记忆和长期记忆(LeCun厌恶把CNNs比作大脑，相反他更喜欢这个模型：一个带有50亿把手的黑箱)。

　　记忆单元允许研究者向该「记忆网络」讲说一个故事，随后使该网络回答关于这个故事的问题。

　　故事选自《指环王》一书。我们不把全书而是书中主要情节的简短概述(「比尔博拿到了魔戒」)讲给「记忆网络」，当被问及在书中某一具体情节中魔戒在哪里，这个「记忆网络」能做出简短正确的回答。Facebook 熟悉科学官Mike Schroepfer说(他强调技术可以帮助Facebook以更高的精确度向人们展示其想看到的)这意味着它理解书中事物与时间的关系。

　　「通过搭建能理解世界的本质、了解你所想要的是什么的系统，我们就能帮助你。」 Schroepfer在三月的一个开发者报告会上说道：「我们能搭建出一个系统，确保让所有人可以把时间花在他们真正关心的事情上。」

　　FAIR团队正在围绕这个目标开发一个被称为「嵌入世界」的项目。在该项目中，为了帮助机器更好的理解现实，FAIR团队正在教它们用向量表示所有事物之间的关系，如：图像，帖子，评论，相片及视频等之间的关系。神经网络也在构建一个包含了能组合媒体内容、不同个体之间的距离等错综复杂内容的体系。

[1] [2]

JIFANG360.com - 机房360

Facebook如何使用“我们”的数据去构建人工智能