构建语音识别技术壁垒,作业帮语音弹幕为课堂增温

为了全方位模拟线下课堂的高频互动场景,突出小组化学习理念,作业帮技术团队用了一年多的时间,借助AI语音交互、视觉互动等手段,不断丰富小组直播间的交互功能。语音弹幕作为其中第一个语音类产品,首先打破了在线直播课的沉默。

从键盘到话筒,多方案化解语音弹幕技术难点

为了改变传统大班线上课冷冰冰的氛围,在充分调研学生及家长的需求后,语音弹幕的研发需求被正式提上了日程。本着“试水”的心态研发上线后,团队却收到了意想不到的良好反馈。

从技术层面来说,语音识别在行业里并无秘密,但从在线教育场景来看,语音弹幕的瞬时高并发成为了最大难点。

暑假期间突发的高频次使用,让作业帮后端机器面临巨大的压力。为了抗住这“甜蜜的负担”,技术团队紧急增加机器,以几十万的成本使全公司集群扩了一倍。

在扛过了2020年暑期课程的难关后,技术团队化被动为主动,通过更加灵活的架构、行业最低的动态扩收容成本,持续研发支持几十万路并发的“端云一体”,最终从硬件层面成功化解瞬时高并发的技术难题。

自研自动筛选数据算法,作业帮巧妙突破语音识别技术瓶颈

在硬件准备到位后,技术团队开始对语音识别技术的准确率精细打磨。对于新闻类、速记类语音识别功能来说,接近100%的准确率并不稀奇,但在针对低龄小学生语音的场景下,准确率会因各种原因大打折扣。“尚处语言学习阶段的小学生语音表达不清晰、答非所问,又或者家长在一旁引导、方言和口音、环境噪音等问题,都会影响语音识别的准确率。”

据了解,目前方言识别在全行业尚无好的解决办法,只能靠手动标记;对于环境噪音,研发团队则采用传统的信道方法,提取其声学特征后判断过滤。

但在专业领域识别上,语音弹幕依靠丰富且独特的在线教育场景,提供足够量的资源库。相关研发人员表示,“和互联网大厂相比,算法的创新性很难,但是从玩法来说,在线教育场景将会助推技术发展到极致。”

摈弃手工标数据,作业帮技术团队攻坚克难,研发出一套自动筛选算法,能在短时间内自动挑选领域内数据,并迅速学习增强自身模型。

除了在技术上不断精进外,技术团队也积极推动着产品、研发闭环的打造,充分尊重和重视用户需求,以做产品的心态持续推动技术研发升级。

AI技术持续升级释放科技势能 作业帮架起通往教育普惠桥梁

小组直播间上线后,为使直播课堂进一步向“即时交流”的线下课迈进,作业帮基于自身技术能力,增加了丰富多样的高频互动场景和AI互动功能。

近年来,AI技术逐渐进入大众视野。但对研发负责人王强强来说,AI技术的发展应用前景远不止于此“虽然目前AI技术仍处于感知智能阶段,远未达到认知智能的预期,但是它的前景是很远的。”

而在线教育,则是AI技术很好的一个应用场景。“AI对于在线教育来说最大的益处在于,让学生随时随地有一个老师”。未来,AI交互更加智能、自然,有利于在线课堂线下化的发展趋势。

谈及对于在线教育资源普惠的理解,王强强认为,对那些暂无机会直接接触优质信息资源的孩子来说,在线教育以跨越时间、空间的普惠性,缩短着由资源差异带来的信息差距。

未来,作业帮将持续推动产品功能升级,以科技引擎赋能教育普惠,让优质资源教育触手可及。

声明:本站转载此文目的在于传递更多信息,并不代表赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本网联系,我们将在第一时间删除内容,本网站对此声明具有最终解释权。
Copyright © DoNews 2000-2024 All Rights Reserved
蜀ICP备2024059877号-1     京ICP证151088号
京网文【2018】2361-237号