机房360首页
当前位置:首页 » 业界动态 » 走进当当网:精益设计实践与营销技术中的算法

走进当当网:精益设计实践与营销技术中的算法

来源:CSDN 作者:yuxin编辑 更新时间:2014/3/14 15:55:58

摘要:3月12日,CTO俱乐部会员们近距离了解当当,此次“CTO俱乐部走进当当网”活动吸引来自50家左右的企业技术高管,现场参访当当网,并与当当网技术部相关人员就精益产品设计和营销技术算法等话题进行探讨。

  图书是当当的起家之本,百货作为公司今年战略重要的一部分,是要发力的地方。鞠奇在图书这块分享的是图书的推荐和图书的评论处理,做了一些小的算法改进。在百货这方面,他从最直接能够抓住用户心理的品牌角度进行了一些挖掘。

  “图书推荐这块,第一部分是最佳拍档的优化。这个里面我首先回顾一下我们最常用的关联规则,并提出了关联规则里面存在的几个问题。然后我们发现这几个问题,严重影响了我们线上的效果,进一步分析了内在的原因,发现大部分都是我们“大单”引起的。就是同一个订单里面有很多件商品。因为当当图书卖的很多,有很多活动,所以大家很愿意把很多次购买意图,放到一个订单里面,形成一个大单,影响我们最佳推荐的效果。真正的大单需要被分解还原用户的意图。”鞠奇说道。

  “存在的第一个问题是必然两本书存在不同的订单里面,他们共同购买意义应该是不一样的。怎么处理?我们就思考,任何订单里的两本书之间的关联权重,需要考虑,这个订单里面有多少其他商品,其他商品多少个。越多的,这个权重比较低,如果就是两本书,它的权重就比较高。针对这种思考,我们做了一个处理;第二个问题,即使在不同的订单共同出现了相同的商品件数,我们发现这个商品可能是一个畅销品,关联过万,这个过百。这本书跟很多关联,某两个之间的关系弱于其他之间的关系。从这个想法出发,我们做了一个类似IDF的处理;第三个问题,偏好意图混淆,怎么还原消费者的意图。哪些商品是偏向于一次性购买的。考虑到加入购物车的时间点,我形成一个大件,我买很多书,但是我不可能一次性做出决定,我一次可能只对我一种偏好做决定,把它放到我的购物车里面,在某个节点上一次性购买。我们会考虑加入购物车的因素,来进行分解。然后有的时候加入购物车的时间还不够,我们可能会考虑书和书之间主题相关的一致性。我看到的和我买到的可能相似,我的兴趣可能不断的变化,但是我一次购买的意图是一样的。我从加入购物车的时间来做一个分解,或者我从所有的图书里面的一个内容的相似性方面做一个分解。综合上面三个策略,我们就做出更合理的整体关联权重。”鞠奇仔细解释道。

  在讲到有关评论排序推荐时,鞠奇举了自己身边的例子,“前两天我妈从老家打电话,我侄儿已经好几岁了,让我在当当网上找几本书买给他,哪本书卖的比较好?我就找童书榜Top3及其对应的评论,前面评论都是‘商品不错’、‘正版’等,再看看客户评分这么高,评论这么多,我想看到的评论到底在哪呢?为什么那么难?这个问题已经困扰了我们,也包括我们总裁好久了。怎么让用户决策,找到他想看的东西呢?”鞠奇继续说道“通过算法,把五星级的、加赞的或者有文艺评论的提到前面去,把比较普通评论的、‘不错’,比较‘二’的评论打压。其实就是大数据加自然语言处理的事。”

  最后,结合当当网2014年战略,鞠奇谈到了有关百货方面的工作,因为当当网的百货品类比较多,用户买了这个再买其他什么东西,这就是互补类别的计算。当完成互补类别计算后,怎么确定品牌是否具有相同的风格或者质地,是否有相同的档次,怎么确定这些呢?“我们从一批优质用户着手,找到这批优质用户,我觉得这批用户提供给我们的数据比较靠谱,所以我们会挖掘优质的用户。得到优质用户数据之后,我们在他们点击基础上,进行品牌相似性的计算。”鞠奇介绍说,“ 2014年我们会从图书音像转到百货。百货里面品种非常丰富。我们的用户都发愁买什么百货,老板也不知道用什么吸引用户。我们最直接、最简单的方法,就是通过品牌。用户越来越偏向使用品牌,去找品牌。觉得质量有保证。电商发展品牌,像天猫一样,发展商城,发展店铺,更有利于我们的经营。”

 

  现场Q&A环节

  主持人:算法团队有多少人?

  鞠奇:现在确切来说算法团队在建立之中。

  傅强:我们定位算法研究员不带人直接汇报给我,我现在的职位当当网技术部的副总裁,我汇报CTO,负责开发工作,跟他汇报层级的开发总监,很资深的经理。他之所以不带人,不消耗和人、团队打交道的精力,老老实实做算法。你的几行代码,一个小参数,给当当能多赚好几千万。

  提问:我想请教一下鞠奇,你这里做了很多高深的东西我不太懂。其实还有一个层面,你对用户心里的分析,这方面是一个非常很根深的东西,关于心里分析这块能不能分享一下经验,用户消费,心里过程,或者心里分析?

  鞠奇:您确实很厉害,一下就看出来了。其实那些所谓的您听不懂数学公式,那些很简单,这方面的硕士、博士都可以知道,都可以应用。在数据挖掘和心理学这方面,怎么把数据公式和算法和实际的业务数据结合起来,这是最难的一件事。我整个PPT里面讲了4个主题,我用一个最简单的算法,就是TF-IDF,我把这个东西贯穿到很多主题里面,我在不同的场景里面做了不同的应用。TF-IDF大家都知道,但是我用到品牌计算里面,用户挖掘里面,用户评论里面去。我们的算法很简单,怎么样结合我们的数据,把数据吃透了,把它们进行有效的融合。

机房360微信公众号订阅
扫一扫,订阅更多数据中心资讯

本文地址:http://www.jifang360.com/news/2014314/n116257110.html 网友评论: 阅读次数:
版权声明:凡本站原创文章,未经授权,禁止转载,否则追究法律责任。
转载声明:凡注明来源的文章其内容和图片均为网上转载,非商业用途,如有侵权请告知,会删除。
相关评论
正在加载评论列表...
评论表单加载中...
  • 我要分享
推荐图片