机房360首页
当前位置:首页 » 厂商动态 » 神秘的谷歌数据中心技术探秘

神秘的谷歌数据中心技术探秘

来源:pconline 作者:机房360 更新时间:2010/7/10 1:39:49

摘要:谷歌的数据中心高度机密,我们所能得到的信息十分有限。我们先来看几个数据:谷歌在美国本土的数据中心有19个以上,另有17个分布在美国以外的世界各地;每个数据中心有50万平方英尺(46450平方米),建造一个数据中心要花费约6亿美元......


2、对查询结果进行过滤处理。包括以下几点:

2.1、对通常的查询,谷歌会把相关的专题性垂直搜索结果(比如新闻、购物、视频、书籍、地图等)也加到返回的查询结果中。

2.2、个性化,用户访问过的网站在查询结果列表中会更靠上

2.3、大量使用锚点的网站有可能被从查询结果中删除

2.4、如果网页被其他高PageRank的网站引用,则网页的重要性会大大提高。

2.5、趋势分析:对搜索流量爆增或有大量新闻的搜索关键词,谷歌会在新的查询结果中增加额外的PageRank权值。

2.6、同一个域名下的多个网页如果具有相同的PageRank会被归为一组。

2.7、查询结果最终形成(将与广告一同显示)
 
搜索结果如何与广告相结合?


  1、Google根据关键词、广告类型、用户所处位置找出相关的被竞价拍卖的关键词广告

1.1、关键词广告必须遵守当地法律条文。广告业主的非法广告将被取缔,如果关键词的搜索流量过低或关键词广告点击量偏低,则会被自动禁用,出于商业策略,像亚马逊这样的客户会给予优惠折扣。

1.2、关键词相关广告按收益潜力排序。

1.3、对广告业主来说广告内容一般是固定的,但有时使用动态关键词使关键词广告与搜索关键词相关度更高。一些广告允许增加附属信息,比如网站链接、电话号码、产品链接、地址等。

1.4、如果广告拥有相当高的点击率,则会显示在搜索结果列表的上方,以使其更显眼。

1.5、其余的广告依序显示在页面右侧

经过上述一系列复杂的信息处理过程,最终返回给用户的是一个个性化的、具备地理位置特征的、布局简洁的查询结果页面,当然还精确匹配了广告,所有这些步骤在总共不到1秒的时间内完成,每天3亿次的点击量给Google带来了超过200亿美元的年收入

关于精确广告匹配的小例子,请看下图:


  海芯博业的广告下面标注了北京市三个字,可见这是一个地区性的广告推广,在广州搜索结果中不可见。

 谷歌官方对其搜索技术的叙述

我们搜索技术的后端软件会在服务器侧触发一系列执行时间不到1秒的并行计算,谷歌问世前的传统搜索引擎的搜索结果严重依赖于关键词在页面上出现的频度,我们使用了200多个指标信号(其中包括我们拥有专利的PageRank页面等级加权算法)用来检查万维网的链接结构并决定网页的重要程度。

我们假定一个网页的重要程度取决于别的页面对它的引用,就像学术论文中的引用指数一样,重要的论文总是会被很多其他论文引用。然后我们再根据搜索条件进行超文本匹配分析(对“爬虫”抓取的页面内容进行关键词倒排索引检索)确定跟搜索请求最相关的网页。综合最重要的网页和跟搜索请求最相关的网页两个方面,我们就能按重要程度和用户搜索请求相关程度把查询结果排序后呈现给我们的用户。

附:Googlegraphic原图,分辨率1195x2074像素,点击下图看大图。


    责任编辑:kelly

机房360微信公众号订阅
扫一扫,订阅更多数据中心资讯

本文地址:http://www.jifang360.com/news/2010710/n99297927.html 网友评论: 阅读次数:
版权声明:凡本站原创文章,未经授权,禁止转载,否则追究法律责任。
转载声明:凡注明来源的文章其内容和图片均为网上转载,非商业用途,如有侵权请告知,会删除。
相关评论
正在加载评论列表...
评论表单加载中...
  • 我要分享
推荐图片