近期,科大讯飞在北京隆重推出了讯飞星火大模型V4.0及一系列实际应用方案。这款新版本显著提升了七大关键性能指标,整体表现超越了GPT-4 Turbo,在全球八个主流评估测试中占据首位,标志着中国大模型技术的全面领先地位。
与此同时,讯飞星火语音大模型进行了升级,新增了国际顶尖的多语种多方言免切换识别功能。在发布会上,科大讯飞展示了讯飞输入法的方言外语免切换语音输入功能,极大地提高了用户的输入效率。
刘庆峰指出,语音将引领万物互联时代的交互潮流,特别是远场环境下,面对高噪音、多语言、多方言以及全双工交互的需求,AIUI(人工智能用户界面)需具备相应特性。科大讯飞主导制定的全双工语音交互ISO/IEC国际标准已于今年五月正式发布。
在此背景下,讯飞星火4.0版本的发布,不仅带来了国际领先的多语种多方言免切换语音识别能力,支持多达37种语言和方言的“自由对话”。相较于OpenAI whisper-V3,37种语言识别效果更为出色;而在37种方言的识别上,平均提升了30%的精度。现场演示中,工作人员通过讯飞输入法的免切换模式,成功实现了多种方言和外语的高效输入。
作为中文语音输入领域的先驱,讯飞输入法持续优化其语音识别技术,从单一普通话扩展至方言,再到方言免切换及多语种多方言免切换,旨在满足用户日益多样化的需求。步入大模型时代,输入法与大模型的深度融合,展现出前所未有的智能化与个性化。未来,我们有理由期待,语音识别不仅能够精准识别我们的语言,还能捕捉我们的情感,甚至预判我们的需求。