初敏:见证语音交互技术从实验室到产业
2023-12-14 06:33:54
从实验室到产业,见证语音交互技术演进
初敏认为,语音交互技术发展已经走过很长的一段路,并迎来了一个较成熟的阶段。语音识别、语音合成、语感理解、以及对话管理等技术模块,都已经达到了比较好的效果,现阶段已经可以落地应用到产业端。如果与数十年的发展历史,在近年来又得到了迅猛发展,从实验室走向产业过程,是初敏亲自经历的。作为一名语音交互技术的先行者,初敏一直与产业界和学术界的动向。从相关专业的大学毕业后,初敏在留校任教之后选择就读香港理工,并在硕士在读期间遇到了语音交互技术,“我就很热衷这个方向,就是如何把这个技术做好。我觉得它真的很酷。”那两年她拿到了多项计算机学会的评优证书,参加了那会顶级的会议,她发现产业有广泛的应用场景,实现商用并解决落地的问题。做很厉害,如何实现商用和实现落地,在从实验室走向产业的过程中,还有很深的。
用对技术发展的深刻理解将深厚的技术积累转化为产品落地
很自豪的是,早年间在实验室从0到1做出来的技术,现在已经广泛应用,正在影响各行业的公司和机构,以及数亿人的生活。自己多年的积累不会浪费,实实在在的技术实现落地,这种成就感是其他方式完全替代不掉。初敏现在是思必驰的联合创始人兼CTO,她认为语音交互的落地应用场景,现在已经涉及到生活当中各个方面。过去只能被大家玩作为“新奇”的玩具来玩,但现在已经是必备的和必需的功能,而去年发布的会解放人类的双手的眼睛,各相关的产业都在猜测中,这种强势的需求一定会迫使人工智能的功能。
对语音交互技术趋势和发展的独到见解
初敏认为,语音交互领域的新兴技术有发展空间,但语音交互行业的重点还会是自然对接、个性化、场景化上。语音交互可以做的更多事,解决更多的落地问题的决策。目前语音交互的终端设备有分化、终端设备便携性和互动性不断的出现,这种技术如何能够在软硬件协同设计之后结合,交互如何进行迭代和优化,各产业针对各个应用场景要解决的问题还有,很多都值得研究。技术的出现,特别是AI技术,使得语音交互的产业落地,真正的基于场景、基于数据、基于特征的这些东西,在语音交互的交互的特性中没有体现,在和语音交互的结合过程中还能怎么促进这种交互的演进,值得继续研究。面对上述问题,初敏喜欢的是如何构建一个人工交互式,或者更广泛,如何构建一个安全的、健康的,技术上可行的、经济上可行的、可以落地的智慧生活。现在的实现方式,对于人们各方面的,还需要研究。
写给对语音交互技术兴趣的你
初敏对语音交互技术感兴趣的人,喜欢与语音交互技术打交道的人,表示欢迎,而未来的发展情况应该会给现时代的语音交互技术工作者带有很多惊喜。她认为,现阶段语音交互已经逐渐成熟和进步,相关的公司可以把语音交互技术作为核心组成部分,应用到自己的产品中。语音交互技术从实验室到产业的演进,又有着技术的进步,技术创造商机,商机推动技术发展,两相促进,相融相成,不可能存在一个非此即彼。从从业者的角度来看,初敏表示,不管是做研究、做技术还是做产品,对一个已经出现成熟的技术不感兴趣,不会让在,企业进行常规的技术改进,而企业的常规改进无法带来更大的进步.技术怎么将语音交互做的,只有步调够稳健才会实现。