机房360首页
当前位置:首页 » 会议/培训/展会 » KDD CUP重磅开赛,认知智能时代她来了

KDD CUP重磅开赛,认知智能时代她来了

来源:机房360 作者: 更新时间:2020/4/1 13:44:27

摘要:迈入2020至今,南北半球先后经历罕见地震、森火、蝗灾等不寻常时期,各国在不同程度上疲惫开年,而今全球进入抗击新冠肺炎的紧急状态,大家纷纷求问能否重启2020。

  这场脑力「世界杯」和你没有关系?它可是未来

  全民「世界杯」——你在场外,也在未来这是一场全民制「世界杯」——你在场外,也在未来

  迈入2020至今,南北半球先后经历罕见地震、森火、蝗灾等不寻常时期,各国在不同程度上疲惫开年,而今全球进入抗击新冠肺炎的紧急状态,大家纷纷求问能否重启2020。

  全球范围内各大赛事也纷纷叫停,欧洲杯、东京奥运会先后宣布延期,从品牌赞助、器械制造、到当地旅游,赛事链条上的每一环几乎都不可避免受到波及,然而各大“杯”中,有一座屹立依然——KDD CUP。

  KDD 全称为Conference on Knowledge Discovery and Data Mining,即知识发现和数据挖掘会议,隶 属 于ACM(Association for Computing Machinery)美国计算机协会。

  享有大数据领域「奥运会」、「世界杯」的美誉,KDD CUP已是目前数据挖掘领域最具影响力、拥有最高水平的国际顶级赛事,即使评测标准严格、论文接收率极低,每年仍会吸引大量世界数据挖掘界的顶尖专家、学者、工程师、学生等前来角逐,2018年参赛队伍曾达到4200余支。

  溯源至1997年,KDD CUP每年举办一次,早期主办权几乎由包括微软研究院、雅虎在内的西方顶尖企业和研究机构主导,近几年,中国力量逐渐显现,无论从参赛规模、获奖情况和主办权的争取上,都能嗅到中国企业在数据领域的奋起直追,继2017年以后,今年KDD CUP主办权再次花落阿里。

  今年KDD CUP 将于4月正式开放报名,阿里巴巴为参赛团队准备了两大赛题:

  赛题一:多模态商品推荐

  围绕“电商场景的多模态商品推荐”,该赛题要求选手针对给定的文本召回最相关的商品图片和商品视频。

  举例来说,假如你在某个视频里看到一件好看的T恤,去电商平台输入“白T恤 卡通” 等关键字,很难精准找到。而“多模态商品推荐”支持图片和视频上传,你可以把视频里心仪的T恤截图出来并上传,系统会智能识别、分析并匹配到与之最接近的产品,推荐到正确商品的几率会大大提高。

  为本次比赛,阿里巴巴提供了300万以上的数据集,每条数据包含配对的商品标题文本、商品图片和视频,供参赛选手训练模型。测试过程中,主办方将提供比赛所用的文本描述及可供召回的商品图片和视频,选手需要根据这些描述召回与之最相关的图片视频。

  赛题二:Fairness of Exposure 消除人工智能偏见——曝光偏差

  由于机器学习、深度学习在拟合数据时会毫无保留地把其中的偏见也吸收进模型里,在电商场景中,体现为推荐和曝光常集中于少数热门商品。

  打开手机购物,难以避免,算法总是向你推荐大品牌、热门商品,而一些物美价廉的出自小企业的产品可能被忽视。

  本赛题旨在削弱马太效应的影响,避免强者更强、弱者更弱,保证公平性。

  可以看出,延续历年习惯,今年赛题继续回归产业应用,不是要科技人员闭门造车,而是洞察了真实生活需求,并捕捉当前视频内容流行大趋势之后的思考与行动。

  2019年,全球零售电子商务销售额达3.53万亿美元,电子零售收入预计到2022年将增长至6.54万亿美元,预示了强劲市场潜力。

  人们的生活方式也在变化:销售实时流媒体,名人线上直播带货,社区发布照片和段视频分享生活方式等新模式,都对为消费行为产生巨大影响。

  生活中经常遇到这样的情况,女生跟她朋友说“你这个东西真好看,求分享链接”。但更多数时候,比如你偶然刷到的短视频中背景里有一个酷炫的键盘,你想拥有但根本无处可问。

  这样的情况比比皆是,看一小时视频种草一堆东西,那么问题来了,要如何搜索同款呢?

  为了解决这些伴随新兴消费模式而来的痛点需求,本次比赛在电商这一庞大场景中,测试多模态技术,革新人工智能的信息抓取、分析和商品推荐能力,推动认知智能研究向前。

  相比对文本、视觉元素进行单线地识别分析,多模态技术涉及对包括文本、图像、视频在内的多种信息模态进行综合研究,更接近人类与外界交互方式。

  随着语音识别、自然语言理解、视觉分析等技术逐渐成熟,人工智能在感知智能领域已取得长足进步,解决了“听、说、看”的问题。

  然而,人是有思想的芦苇。人类与世界交互很重要的部分在于获取信息之后的分析、推理、和反馈。感知智能之后,能够进行“思考和反馈”的认知智能是必经之路。Gartner将认知系统定义为,包含了能够进行处理信息输入并转译输出元素的自然或人工系统,是能进行交互,理解、分析原因、和学习的系统。感知智能之后,能够进行“思考和反馈”的认知智能是必经之路。

  2020年1月,阿里达摩院发布《2020十大科技趋势》白皮书,位列第一的趋势预测即为,人工智能从感知智能向认知智能演进。

  随着语音识别、自然语言理解、视觉分析等技术逐渐成熟,人工智能在感知智能领域已取得长足进步,解决了“听、说、看”的问题。但据达摩院白皮书分析,人工智能在需要外部知识、逻辑推理、或者领域迁移的认知智能领域还处于初级阶段。

  相较于感知智能这一人工智能1.0,人工智能2.0将做到真正意义上的认知智能。

  认知智能的研究不仅关系着除了在电商行业,在金融反欺诈、搜索推荐等其他领域同样具备应用价值。结合目前多元的信息来源和交互方式来看,进行认知智能研究除了不仅能拓展交互搜索方式、提高精准度,还为用户创造更流畅有效的用户体验。

  除了在电商行业,金融反欺诈、搜索推荐等其他领域同样具备应用价值。

  达摩院白皮书指出,相较于感知智能这一人工智能1.0,人工智能2.0将做到真正意义上的认知智能,。

  这一技术的实现将更多地依靠数据,自动将非结构化的数据转变为结构化的知识。,并且结合语言学、认知心理学、脑科学等学科以及人类社会中的经验,赋予机器常识和因果逻辑推理能力,实现认知智能,成为当下人工智能研究的趋势和核心。

  阿里巴巴是最早研究认知智能相关技术的科技公司之一,过去几年取得了一系列研究成果:20多篇认知领域论文,入选国际顶会KDD、IJCA、ACL、VLDB、CIKM等,并在2019年HotpotQA(full-wiki)阅读理解比赛排名第一,大幅领先第二名。

  本届KDDCUP紧盯趋势,邀世界数据挖掘界的顶尖专家、学者同台博弈。认知智能这一赛题看似是人工智能高精尖科研人员的竞技场,实则,与每个人息息相关,参赛者们亲自谱画理想阶梯,而场外观战的看官们,也将有幸见证这一未来之势。

  (正文完)

  责任编辑:张华

机房360微信公众号订阅
扫一扫,订阅更多数据中心资讯

本文地址:http://www.jifang360.com/news/202041/n3008128446.html 网友评论: 阅读次数:
版权声明:凡本站原创文章,未经授权,禁止转载,否则追究法律责任。
相关评论
正在加载评论列表...
评论表单加载中...
  • 我要分享
推荐图片