机房360首页
当前位置:首页 » 云计算资讯 » 语音云:乘着移动互联网和云计算东风

语音云:乘着移动互联网和云计算东风

来源:IT经理世界 作者:yolanda编辑 更新时间:2012-6-22 16:38:30

摘要:一则荣威车主“调戏”iVoka的视频在网上流传甚广——iVoka是荣威350上装配的语音云驾驶系统——当车主对着iVoka说“我爱你”的时候,iVoka不无醋意地表示“这句话你也对Siri说过吧”,车主只好无奈认栽。

  事实上,对于iVoka这种全新的智能语音人机交互装置,逗趣唠嗑只是其“副业”,连接豆瓣点播音乐、查天气、查股票、查航班、查实时新闻资讯等等,才是它的正经功能——在这一应用背后,是一家叫科大讯飞的公司所提供的语音技术。
  
  2012年3月22日,北京国家会议中心,科大讯飞“新一代语音云平台”发布会现场。科大讯飞CEO刘庆峰拿出一部智能手机,开始演示公司开发的新应用“讯飞语点”。他用自己的声音命令手机发短信、安排日程、查找餐馆,还不忘调侃手机:“你能做什么”?手机回答道:“我正在反思自己的不足。”现场立刻笑声一片。
  
  一切都像极了当年由乔布斯掌控的苹果产品发布会现场。
  
  苹果公司的Siri大热,将语音技术的消费应用提到了日程上,各行各业都在挖掘自己和语音的结合点;而像科大讯飞这样的语音技术提供商则希望在更广泛的消费应用方面和不同的开发商合作,找到更广阔的天地。
  
  移动引爆语音
  
  人们对下一代语音交互方式的美好畅想,从来就没有停止过。不过,在很长一段时间内,语音技术被看成是鸡肋:弃之可惜,食之无味。微软、谷歌、IBM,这些世界级的IT巨头,一直在语音技术商用方面努力探索。然而,前景虽然很美好,语音技术却始终无法实现大规模民用。
  
  “我当年在微软工作的时候,曾听到比尔·盖茨说:‘语音技术在5年后将改变世界。’5年之后,我又听到他说了一次;到了第三个5年,比尔·盖茨有一次提起语音,他说:‘这话我过去说了两次。’”创新工场CEO李开复所讲述的这件往事,折射出语音技术当时所面临的尴尬前景。
  
  而前谷歌中国的高级研究员、《浪潮之巅》的作者吴军最近在微博里调侃道:“语音识别(在产品上)忽悠人从上世纪90年代开始,大约每10年一个周期,最后的结果相同,就是大家发现这是个玩具,而不是工具……如此反复。不过我相信最后有一次不再是忽悠人,但是不是现在这一次?”
  
  至少,在扑面而来的移动互联网和云计算大潮中,想象从来没有像这一次这么像真的:决定语音识别技术精确度的关键性因素在于语料库的丰富程度。
  
  在过去,语料库的建立,主要是通过人工采集声音信号来完成,需要花费大量的时间和精力,语料库的增量非常有限,这也意味着语音技术的精确度提升速度非常低。而在移动互联网时代,语音交互的终端和应用在不断涌现;另一方面,云计算能够处理比以往更海量的用户语音交互数据,云端的服务器能够不断收集、处理这些数据,在不断反馈训练中持续进化语音理解能力。
  
  并且,随着移动用户和多种移动终端的爆发式增长,人们对语音应用的需求前所未有的强烈:移动终端设备键盘与屏幕尺寸小,用手指输入并不方便,尤其是在移动的应用场景中,眼忙手忙,语音输入作为信息交互最自然、便捷的手段,更能发挥它先天性的作用。
  
  而苹果公司所推出的Siri功能在全球所引发的疯狂,则成为语音技术在移动互联网上被引爆的直接导火索,也让一直苦于找不到语音卖点的厂商茅塞顿开。苹果的高明之处,在于将Siri的语音技术与苹果封闭系统内的各行各业的信息服务、应用进行了无缝的对接,并且整合了三大数据库:Yelp、维基百科、WolframAlpha,这就意味着Siri不仅仅是一个被人“调戏”的玩具,而是在某种程度上可以帮人们解决实际问题:查找餐馆、地图、翻译……
  
  尽管在目前看来,Siri的实用性依然有限,但随着用户越来越多,建立的语料数据库就越丰富,就越能通过数据的不断纠正变得越来越“聪明”,这就有了“人工智能”的意味。
  
  在这个横跨手机、平板电脑、汽车、电视、导航设备、音乐播放器、个人电脑等领域的绝大市场商机面前,谷歌、微软等国际巨头都加快了将语音技术向消费级市场商用的脚步:谷歌计划今年上半年发布平板电脑GoogleNexus,并将搭载Majel网络语音识别技术;而微软于2007年收购语音技术公司TellMe之后,计划今年将TellMe技术用于Windows8及下一代WindowsPhone系统中;此外,国际语音巨头Nuance已经将语音生意做到了全球,且来势凶猛:今年1月份,Nuance收购了竞争对手Vlingo,期望整合双方各自的技术优势,在全球迅速膨胀的移动语音消费市场,瓜分更大的蛋糕。
  
  平台机会
  
  随着Siri在全球的大热,人们不禁纷纷发出这样的疑问:谁是中国的下一个Siri?作为国内最大的智能语音技术提供商,原本低调隐匿在背后的科大讯飞就这样站在了舞台的正中央。
  
  在过去,科大讯飞的生意模式更多的是面向B2B市场,主要为电信、金融、教育等企业和各种行业提供语音支撑软件或语音应用系统。尽管也推出了诸如“讯飞口讯”这样的消费层面的应用,但始终是扮演着技术提供商的角色,其业务增长稳健而缓慢。“调戏Siri和Siri的人工智能其实只是目前语音相对简单的部分,我们之前做得不够好的地方可能是,我们一直重视产品本身在技术层面的不断精进,却忽视了这些有趣的东西可以给消费者带来更多的乐趣。”科大讯飞信息科技股份有限公司研究院执行院长胡郁表示。

本文地址:http://www.jifang360.com/news/2012622/n642537507.html 网友评论: 阅读次数:
版权声明:凡本站原创文章,未经授权,禁止转载,否则追究法律责任。
相关评论
正在加载评论列表...
评论表单加载中...
  • 我要分享
更多
推荐图片