爱尔兰初创公司 SoapBox Labs 的愿景是创建“世界上最精准的儿童语义理解知识库”,并计划向那些支持语音交互的教学APP、智能硬件、物联网设备以及AR/VR设备提供能第三方技术接口。
SoapBox Labs 由前贝尔实验室的研究员 Dr. Patricia Scanlon 于2013年创立,他在语音识别与语义理解领域拥有近20年的经验。
在对语音识别做研究的过程中,Scanlon 发现由成年人建立的语音库并不能很好的理解儿童的语言,包括在 Amazon Echo 与 Google Home 等设备都出现了在与儿童交互的场景下的识别错误的现象。
之所以发生这类问题,除了孩子具备更高的音阶以及不同的言语模式外,更为重要的是,与成年人不同,孩子并不擅长按照机器能理解的方式与其交互,无论是我们有意识地还是无意识地为了采用了更有好的交互界面抑或是更加智能的语音助理。
Scanlon在一次电话会议中解释道,当她和 SoapBox 实验室团队在 2013 年开始研究这个问题时,经过广泛的研究后,很明显“儿童的言语行为与成年人有很大的不同”,使用成人语音数据开发的语音产品去为儿童服务时,准确率低下的问题一直都无法被解决,所以,团队决定不得不暂时忘记团队过去在构建语音识别方面所积累的知识体系。
于是,SoapBox Labs 开始创建自己独特的儿童语音数据集,目前已有数千小时的儿童语音数据组成,并将其团队对儿童语音和行为模式的理解相互结合。SoapBox Labs 正在利用这套深度学习的算法与从事儿童教育的初创公司合作,共同开发,前者提供算法,后者提供数据源。
SoapBox Labs 目前已经发布了一个供第三方使用的英语儿童语音识别API,此外,公司还披露了最新的融资进展 —— 210万欧元,包括150万欧元的欧盟赠款与60万欧元的股权投资。截止今日,SoapBox Labs 共获得超过300万欧元的资金。
关于儿童语音识别技术的未来,Scanlon表示,未来无论是针对儿童还是针对承认的语音识别都将集成到一个载体内,机器能够识别说话的主题并根据底层数据模型切换到相应的模式。