智能语音将成下一代人机交互新入口

时间:2018年01月11日 10:48 来源:南方日报 
0
您当前的位置 : 每日甘肃网  >  甘肃经济网  >  经济产业

  2017年11月,国家科技部宣布科大讯飞以智能语音成为国家新一代人工智能开放创新平台之一。包括BAT在内的互联网巨头也纷纷抢滩智能语音领域。智能语音为何能成为人工智能领域的重点项目?站在第三次人工智能浪潮的当口,智能语音的应用又将如何改变我们的生活?

  智能语音在多个领域广泛应用

  近几年,国外微软、苹果、亚马逊,国内科大讯飞、腾讯、百度、阿里等企业,无一不在紧锣密鼓地推进智能语音的商业应用落地。

  2011年,苹果Siri语音助手正式亮相。正是以Siri的发布为引爆点,智能语音应用领域由传统行业向移动互联网等新兴领域延伸。

  中国智能语音交互系统的另一家领军企业百度在智能语音领域深耕多年。去年,百度推出DuerOS系统,广泛应用于音箱、电视、冰箱、手机、车载多个场景。在1月9日举行的2018年CES(国际消费类电子产品展览会)上,百度发布了DuerOS 2.0的三款硬件产品——智能视频音箱、智能音箱灯和智能投影吸顶灯。

  百度度秘事业部总经理景鲲表示,根据IDC的报告,在2020年前,27%的智能家庭将会拥有智能语音设备,51%的智能汽车和68%的智能手机和智能穿戴设备也会具备语音对话功能。“DuerOS是一个活跃的对话式AI生态体系,不仅有设备合作商,还有芯片制造商、系统整合商、内容开发者等等。”

  智能语音设备之外,中国企业在语音转写技术、语音输入法方面也走在了商业应用前沿。在2017年的全国两会上,科大讯飞的产品“讯飞听见”利用人工智能实时语音转写技术,首次在政府工作报告网络直播中实现同步字幕直播。此外,智能语音输入应用让讯飞输入法用户突破5亿,截至目前已支持22种方言语音输入,方言识别准确率达90%以上。

  2017年11月,国家科技部宣布科大讯飞以智能语音成为国家新一代人工智能开放创新平台之一。

  对此,科大讯飞股份有限公司品牌管理部总经理、华南公司副总裁吴骏华向记者表示,智能语音之所以成为新时代人工智能应用发展的重点方向之一,一方面来自于语音技术的成熟,另外一方面则是在万物互联的时代,语音成为了人机交互的新入口。截至2017年12月,讯飞开放平台的累计终端数已经达到15亿,日均交互次数达到40亿,创业团队数已经达到了50万。

  五年内将像水和电一样无处不在

  智能语音是人工智能技术的重要组成部分,包括语音识别、语义理解、自然语言处理、语音交互等。目前,在语音识别方面,科大讯飞、百度、苹果、谷歌等主流平台识别准确率均在96%以上,稳定的识别能力为智能语音技术的落地提供了可能。

  “科大讯飞在语音识别上已经做到98%了。”吴骏华表示,在国际语音合成大赛(Blizzard Challenge)中,科大讯飞连续十二年蝉联第一名。在2016年CHiME Challenge国际多通道语音分离和识别大赛中,科大讯飞包揽全部三个测试项目的冠军,并大比分刷新历史纪录。

  百度在2017年宣布ALL IN AI之后,除了发力自动驾驶之外,也在语音智能方面持续发力。百度人工智能技术的方向包括语音识别Deep Speech、视觉识别“智能读图”、自然语言与智能语义等。凭借PaddlePaddle深度学习平台、亿万级大数据训练处理能力和超高速异构AI计算集群三大核心技术,可模拟低龄人脑思维,拥有语音、图像、自然语言处理、用户画像四大能力。“其中,语音识别准确率达97%,支持27种语言互译。”

  除了语音识别之外,语义理解是目前各大企业需要攻克的技术难关。吴骏华坦言,按照目前实现的语音合成和语音识别技术,科大讯飞可以完成在固定的范围内回答问题,但是在逻辑推理上机器今天还是没有办法实现突破。在语音理解没有重大技术突破的前提下,机器在语义理解方面还存在不小挑战。

  国家政策层面,也在大力推动智能语音的发展。去年12月14日,科技部印发《促进新一代人工智能产业发展三年行动计划(2018—2020年)》,明确对智能语音的发展做出展望,“到2020年,实现多场景下中文语音识别平均准确率达到96%,5米远场识别率超过92%,用户对话意图识别准确率超过90%。”对于未来智能语音的普及推广,吴骏华表示,在政策和行业的双重推动下,预计未来五年内,智能语音会像水和电一样无处不在。”

  智能音箱背后是技术的竞争

  在享有“互联网女皇”称号的玛丽·米克尔发布的2016年互联网趋势报告中,超过十分之一的篇幅在论述语音识别交互带来的改变。报告将语音功能赞誉为“人机交互的新范式”,并称语音功能解放了双手和眼睛,扩展了永远在线的概念。市场认为,智能语音交互有望成为下一代人机交互新范式。

  记者梳理发现,目前智能语音的参与者中,可以分为互联网巨头企业、智能语音公司、初创企业三种类型。

  国内以BAT为首,国外以谷歌、亚马逊、苹果为首的互联网巨头,开放语音生态系统,以产业内合作的方式,将语音技术植入产品或应用于相关业务场景,构建全产业生态链。2017年7月5日,百度在北京举办“2017百度AI开发者大会”,发布了DuerOS开放平台,开放技术能力满足智能语音设备开发者的需求。

  而以科大讯飞为代表的智能语音公司,依托原有优势,从单一智能语音技术商向全方位人工智能技术服务商转变。思必驰、云知声、出门问问等初创厂商,则以垂直领域和细分场景为突破口,重点布局家居、车载和可穿戴设备。

  不论哪种类型的参与企业,无一例外都开发了同一款产品——智能音箱。智能语音技术的普及,让智能音箱、智能家居客厅重回大众视野,成为科技巨头的“新宠”。

  通过智能语音交互技术,占领未来智能生活的家庭入口,这是国内外科技巨头纷纷布局智能音箱背后的深层逻辑。

  中大创投联合创始人郑贵辉认为,声音这种最直接的指令方式,被认为是目前最好的人机交互方式,也成为了控制其他家庭硬件的方式。从产业角度看,智能音箱实质是通过声音做智能交互,而音箱只是一个表现形式。现在这些巨头做的智能开放平台,目的都是聚合技术,提升产品的竞争力。“科技巨头们都蓄谋已久,瞄准这个风口。以智能音箱为载体,背后是智能语音交互技术的竞争。”据《南方日报》

编辑:关颖

关于我们 | 版权声明 | 广告业务 | 联系我们

甘肃日报社每日甘肃网版权所有 未经书面授权不得复制或建立镜像 甘肃每日传媒网络科技有限责任公司承担本网站所有的经营业务、内容更新和技术维护

国家互联网新闻信息服务许可证编号:6212006001 ICP备案号:陇ICP备10200408号 增值电信业务经营许可证编号:甘B2-20060007 信息网络传播视听节目许可证编号:2806153