中国信通院泰尔终端实验室发布智能终端方言识别能力首轮评测结果


2025年8月26日,国务院发布《关于深入实施“人工智能+”行动的意见》,明确提出“到2030年,我国人工智能全面赋能高质量发展,新一代智能终端、智能体等应用普及率超90%”,且强调“加快人工智能产品和服务向乡村延伸,推动城乡智能普惠”。然而,要实现真正的“智能普惠”,还需面对我国语言多样性的现实挑战。据中国社会科学院语言研究所发布的《中国语言地图集》显示,我国汉语方言分为10大方言区,每种方言都有独特的发音、词汇和语法体系。这一丰富的语言生态,正是智能语音技术向下扎根、服务更广泛人群的重要场景。

中国信息通信研究院(简称“中国信通院”)泰尔终端实验室积极响应国家“人工智能+”战略部署,推动城乡智能普惠、践行“科技向善”理念,利用自主研发的评测系统于近期完成针对主流智能终端语音助手的地方方言识别能力系统性评测。

本次评测聚焦辽宁话、山东话、四川话、河南话、陕西话五种地方方言。选择依据为:五省横跨东北、华北、西南、中原、西北五大区域,覆盖中国“东密西疏、南繁北简”方言格局中的主要大区;五省总人口超3.6亿,占全国近四分之一,其中中老年及乡村居民日常以方言为主要沟通方式,是智能终端实现“数字包容”优先适配的核心用户群体。

评测对象为国内市场占有率较高的五款主流手机终端。测试方法采用泰尔终端实验室自研的“智能终端方言识别测试系统”,该系统方言覆盖辽宁、山东、四川、河南、陕西五大代表性地方方言区;语音变量统一采用男女双音色,排除性别干扰,支持指令自动生成、语音交互模拟与结果智能判读。指令分层设计简单、复杂、模糊意图三类场景贴近真实使用场景。每类指令生成10条,测试前按各终端官方流程完成终端语音助手的语音模型重注册。结果判定采用“系统智能分析+人工复核”双轨机制,争议项经日志溯源与交叉验证后以人工判定为准。

测试数据显示:在普通话环境下,五款终端三类指令识别成功率均接近或达到100%;在方言环境下,识别率出现明显下降。其中,简单指令识别率最高约80%-90%,最低不足30%;复杂与模糊指令场景下,识别率进一步降低。不同终端表现存在差异,部分终端在特定方言(如河南话、四川话)上表现相对稳定,部分终端在多轮交互与语义推理场景中识别准确率下降明显。 

不同终端对不同地方方言识别的准确率对比
图1 不同终端对不同地方方言识别的准确率对比

本次评测不设排名,不评价产品优劣,旨在建立可复用、可比对的方言识别能力评估基线,为终端厂商优化产品、研究机构改进算法提供客观数据参考,助力“人工智能+”在语言多样性场景下的务实落地。

泰尔终端实验室在方言识别的能力介绍

泰尔终端实验室围绕国家“人工智能+”战略对技术普惠的需求,研发了一套支持多语种方言的自动化语音评测系统。该系统基于自研技术架构,集成AI指令生成与多模态分析模块,可对普通话、粤语、陕西话、辽宁话、四川话、广西话、河南话等十余种主流方言,实现从测试指令自动生成、语音交互模拟到识别结果智能判读的全流程闭环评测。

配套建设“中文方言语音数据资源库”,覆盖东北、西南、中原等主要方言区域,包含超过10万小时人工标注语音数据,以及500万条以上与语音内容语义对齐的文本语料。该资源库支持按区域、语种、场景等维度进行数据筛选与组合,可为企业提供定制化训练数据集,用于优化语音识别模型在真实方言环境下的识别准确率与稳定性。 

智能终端方言识别测试系统
图2 智能终端方言识别测试系统


咨询联系人:

杨  蕾

13552898145

李从胜

13488717674