阿里达摩院公布语音AI与AI EARTH两项新进展能逼近真人语音交互也

作者:神秘网友 发布时间:2020-09-21 01:25:28

阿里达摩院公布语音AI与AI EARTH两项新进展能逼近真人语音交互也

阿里达摩院公布语音AI与AI EARTH两项新进展:能逼近真人语音交互,也能看懂地球每一寸土地变化...

阿里达摩院公布语音AI与AI EARTH两项新进展能逼近真人语音交互也阿里达摩院公布语音AI与AI EARTH两项新进展能逼近真人语音交互也

数据猿作为“2020云栖大会”官方受邀媒体,为大家带来了此次盛会中最精彩的报道内容。

提示:点击文末“阅读原文”可关注数据猿最新推出的【产业图谱+企业盘点】策划活动:《中国数据智能产业最具商业合作价值企业》推荐进行中。

阿里达摩院公布语音AI与AI EARTH两项新进展能逼近真人语音交互也

大数据产业创新服务媒体

——聚焦数据 · 改变商业


9月18日,在2020云栖大会上,达摩院公布了语音AI技术的最新突破:端上语音识别和语音合成能力首次达到媲美云端的水平,这意味着未来个人用户在移动终端即可轻松体验逼近真人的语音技术。据介绍,达摩院最新的语音技术已在淘宝直播、钉钉会议、高德导航等场景大规模应用,正全面对外开放。

语音AI的核心是让机器听懂人话,并能开口说话,语音合成和语音识别技术是实现这些目标的基础。但由于过去几年业界在语音模型上未能有突破性创新,高精度的语音交互任务长期依赖云端算力,造成了语音指令处理不可避免的延时等问题。

此次达摩院率先在算法模型上实现创新,推出E2E-ASR端到端语音识别技术及全新的端上KAN-TTS语音合成技术,首次在移动终端上实现接近云端的语音识别与合成效果。

阿里达摩院公布语音AI与AI EARTH两项新进展能逼近真人语音交互也

据介绍,在语音识别方面,达摩院提出SAN-M网络结构及基于SCAMA的流式端到端语音识别框架,提升计算效率的同时,还将高难度场景中的语音识别错误率降低近三成。达摩院研发的语音识别系统,可纯离线、低成本部署在手机端,原型系统不到40MB,识别效果媲美超过100GB的达摩院上一代DFSMN-CTC云端系统。

继去年发布仿真率可达97%的自研KAN-TTS语音合成模型后,达摩院此次在移动端实现了对语音模型的“大瘦身”,相比云端,端上模型大小压缩了101倍,计算量压缩35倍,通过终端算力即可快速复现逼近真人的语音。例如,高德地图近期发布了利用达摩院全新语音技术合成的李佳琦、林志玲、小团团等明星导航语音包,语音效果较之前更自然,断网状态下语音导航也不会中断。

 

达摩院语音实验室负责人鄢志杰表示,“在终端处理语音任务一直是学术界和工业界的难题,达摩院最新的语音技术有效释放了终端设备的能力,让终端也能轻松处理语音任务,我们相信,在终端算力和云端算力的协同支撑下,未来语音交互将无处不在。”

阿里达摩院公布语音AI与AI EARTH两项新进展能逼近真人语音交互也

过去几年,阿里语音AI取得了一系列突破。2019年,阿里语音AI入选《麻省理工评论》“全球十大突破性技术”,是唯一上榜的中国科技公司;今年7月IDC发布的《中国AI云服务市场半年度研究报告》显示,阿里语音AI以44%的市场份额,在云上语音AI市场中位居第一。

此外,阿里达摩院此次还发布了AI EARTH,全球首次实现多源对地观测数据分析,可看懂地球每一寸土地变化,可精准分析遥感卫星、无人机等影像信息。

从太空看地球,达摩院找到了新方法!

AI EARTH为达摩院发布的首个泛自然资源行业AI引擎,首次实现对天、空、地多源数据精准分析的能力,可清晰记录分析地球每一寸土地变化,大到山川植被湖泊面积变化、小到农作物生长情况,都能快速、精准分析。

 

卫星遥感影像是人类观测地球的主要途径,但随着无人机影像、实时视频流、气象信息、IoT数据等全新数据源的涌现,数据规模呈几何级增长,人工观测和经验分析的方式已无法满足海量观测数据的需求。

 阿里达摩院公布语音AI与AI EARTH两项新进展能逼近真人语音交互也

AI EARTH可分析无人机影像、实时视频流、气象信息、IoT数据等数据源

 

AI EARTH采用达摩院视觉AI技术,是业界首个实现多源对地观测数据的智能分析的解决方案,支持RGB影像、多光谱影像、高光谱影像及普通视频影像,可快速提取地表覆盖现状信息和时空动态变化信息,并且拥有比传统遥感方案更高的精度。

 

据介绍,AI EARTH利用主动学习和半监督学习等技术,自研了多个创新算法。该引擎集成了达摩院自研遥感目标检测及分割框架,引入多尺度环境语义信息,实现遥感图像目标检测准确率的突破。以大棚监测为例,北京市规划和自然资源委员会使用阿里遥感技术,违章大棚房监测准确率达到90%。此外,遥感应用场景极为丰富和多样,同一解译对象在不同空间、时间维度下差异巨大,AI EARTH通过域自适应等迁移学习技术,大幅提升了AI算法在不同场景下的精度及泛化能力。

 

达摩院资深算法专家李昊表示,“未来AI对多源数据的融合分析是人类对地观测的趋势,我们希望AI EARTH能在空天信息领域发挥更大的价值,让AI看懂地球。”

 

阿里巴巴是国内最早将AI技术应用于卫星遥感影像领域的公司之一,相关研究成果已广泛应用于各行各业。今年汛情期间,达摩院团队一周内就开发训练出应用于防汛关键期的水体识别算法,影像分析速度提升百倍,大大提升防汛工作智能化水平。

—— / END / ——

以下内容更精彩


2019数据猿年度金猿榜:

●2019大数据产业趋势人物榜TOP 10

●2019大数据产业创新服务企业榜TOP 15

●2019大数据产业创新服务产品榜TOP 40

2020年度金猿榜,尽情期待!

2020数据猿《#榜样的力量#寻找新冠战“疫”,中国数据智能产业先锋力量》大型公益主题策划活动:

●《新冠战“疫”——中国数据智能产业最具社会责任感企业》榜

●《看过大佬们发的朋友圈之后,我相信:明天会更好,明年定会春暖花开》条漫

阿里达摩院公布语音AI与AI EARTH两项新进展能逼近真人语音交互也

阿里达摩院公布语音AI与AI EARTH两项新进展能逼近真人语音交互也

阿里达摩院公布语音AI与AI EARTH两项新进展能逼近真人语音交互也相关教程

  1. 阿里云开启技术服务新长征 观点
  2. 阿里的这三行代码绝了Java载入史册
  3. 【论文解读】CIKM20-MiNet:阿里|跨域点击率预估混合兴趣模型
  4. 阿里的这三行代码绝了Java载入史册
  5. 阿里香港轻量服务器加上 BBR 会发生什么?阿里云轻量级服务器下
  6. 双非渣本本想去阿里3面过后竟然过了一周后收到offer定级P6+
  7. AGV小车助力阿里犀牛智造新工厂
  8. 阿里巴巴难度系数五颗星的试题,小白竟然说很简单