“让声音被看见”:高校团队打造“声之形”多模态交互系统

2026-03-04 21:42:11来源: 中广网

(通讯员  大连外国语大学  王靖涵)

在地铁站,听障者常会错过广播提示;在路口,听不到车辆鸣笛也可能增加风险;在课堂与会议里,信息跟不上往往意味着更高的学习与协作成本。围绕这些真实困扰,大连外国语大学软件学院学生团队正在推进大学生创新训练计划项目“声之形”,尝试把“听到”变成“看见、感知与理解”。

团队介绍,“声之形”拟研发面向听障及弱听群体的多模态智能交互系统,以AR智能眼镜为载体,整合语音转写与字幕呈现、手势/手语识别辅助、环境声音提醒等模块,为无障碍沟通提供更易用的技术方案。

在面对面交流时,系统可对说话者语音进行实时转写,将字幕叠加呈现在视野内,帮助听障者更快把握对话内容;在需要表达意图的场景中,系统将识别常用自然手势与简化手语动作,辅助完成“手势/手语—文字/语音”的双向沟通;在公共空间中,系统还将对车鸣笛、警笛、火警等关键环境声进行识别与定位,并通过视觉方位提示与触觉震动提醒用户及时避险。

图1  模型数据训练

针对学习与职场需求,项目还计划探索课堂实时字幕、知识要点辅助呈现、会议多声源定位等功能,帮助用户在“信息密集”场景中降低漏听漏看风险。团队表示,这些设计遵循“非侵入式”的交互理念,尽量让提示更直觉、学习门槛更低。

项目负责人王靖涵表示,系统的目标是“看得见、感得到、用得顺”,让听障群体在沟通、出行与学习中获得更稳定的支持。指导教师刘朝霞教授也将从算法与应用场景评估等方面提供指导。下一步,团队将开展原型迭代与多场景测试,持续提升识别准确率与交互体验。

图2  语音识别与字幕呈现页面(软件原型界面)


0
0

我来说两句