马栏山音视频实验室亮相GAS,解锁AI音频新姿势
长沙晚报掌上长沙3月26日讯(全媒体记者 匡小娟)3月25日至26日,中国国际音频产业大会(GAS大会)在上海举行,大会聚焦“声态+AI”,近1000位音频行业精英齐聚一堂,深入探讨AI在音频领域的突破性应用与创新实践。会上,马栏山音视频实验室发表了主题演讲并发布了覆盖“人、家、车、场、内容”五大核心场景的全栈技术方案。
双引擎驱动,AI+智能声场重构音频体系
针对传统音频工业面临的“制作难、体验差、体验不一致”等挑战,马栏山实验室提出“双引擎”战略,以生成式AI降低创作门槛,以智能声场技术统一终端体验。
在生产端,AI实现分轨、混音、空间化与情绪匹配的自动化处理,支持对存量内容进行结构化解析,一键升级为对象化空间音频,大幅提升效率、释放内容价值、降低创作门槛。
在播放端,基于环境感知、声场测量与系统级校准,融合内容元数据与实时空间信息,实现声像定位与混响的动态自适应,同时结合个性化HRTF与用户偏好学习,打造“一人一声场”的沉浸式听觉体验,推动音频从标准化输出迈向智能化、个性化与场景化。

构建全栈技术能力,从根技术到场景落地
同时,实验室构建了从底层根技术到顶层场景应用的全栈技术体系,实现了AI与音频技术的深度融合,全面支撑“人、家、车、场、内容”全场景的智能化体验。
在底层,融合语音识别、理解、合成与情感计算等AI能力,以及音频增强、编码、传输与重建等音频核心技术,夯实技术底座;在中层,围绕“采、编、播、传、显”音频全链路,提供端到端的技术升级与系统化支撑;在顶层,聚焦“人、家、车、场、内容”五大核心场景推动技术规模化落地。
在本次大会上,实验室凭借核心技术能力,斩获多项行业奖项,体现了实验室在音频技术领域的技术沉淀:AI视频翻译荣获产品创新优秀案例,作为出海的神兵利器,可以助力6000+部短剧走向海外,成为“文化出海”的技术标杆;AI陪伴解决方案获得技术创新优秀案例,它不仅是工具,更是具备同理心的数字百科全书;菁彩声家庭智能硬件解决方案获评技术创新优秀案例,是国内首个落地的菁彩声量产方案,让普通家庭无需重金更换设备即可体验沉浸式声场。

实验室还围绕国产标准体系,持续构建核心技术底座,包括:双Vivid(HDR&AudioVivid)GPMI、星闪(SparkLink)等技术标准,并逐步建立专业测评体系,推动行业标准化建设。
“随着AI与音频技术的深度融合,声音不再只是信息载体,而将成为连接数字世界与人类情感的核心接口。”马栏山音视频实验室主任涂永峰表示,未来实验室将继续深耕AI音视频处理、情感智能等前沿领域,深挖“人-家-车-场-内容”全场景潜力。与行业伙伴一起,将“中国标准”推向全球,共同探索音频技术的无限可能。
>>我要举报

