语音识别上难度讯飞输入法免切换识别多语种多方言不迷糊！

投稿
APP
微信扫一扫获取更多

语音识别上难度讯飞输入法免切换识别多语种多方言不迷糊！

阙婷

2024-07-01 00:00:00

图灵汇官网

近期，科大讯飞在北京隆重推出了讯飞星火大模型V4.0及一系列实际应用方案。这款新版本显著提升了七大关键性能指标，整体表现超越了GPT-4 Turbo，在全球八个主流评估测试中占据首位，标志着中国大模型技术的全面领先地位。

与此同时，讯飞星火语音大模型进行了升级，新增了国际顶尖的多语种多方言免切换识别功能。在发布会上，科大讯飞展示了讯飞输入法的方言外语免切换语音输入功能，极大地提高了用户的输入效率。

刘庆峰指出，语音将引领万物互联时代的交互潮流，特别是远场环境下，面对高噪音、多语言、多方言以及全双工交互的需求，AIUI（人工智能用户界面）需具备相应特性。科大讯飞主导制定的全双工语音交互ISO/IEC国际标准已于今年五月正式发布。

在此背景下，讯飞星火4.0版本的发布，不仅带来了国际领先的多语种多方言免切换语音识别能力，支持多达37种语言和方言的“自由对话”。相较于OpenAI whisper-V3，37种语言识别效果更为出色；而在37种方言的识别上，平均提升了30%的精度。现场演示中，工作人员通过讯飞输入法的免切换模式，成功实现了多种方言和外语的高效输入。

作为中文语音输入领域的先驱，讯飞输入法持续优化其语音识别技术，从单一普通话扩展至方言，再到方言免切换及多语种多方言免切换，旨在满足用户日益多样化的需求。步入大模型时代，输入法与大模型的深度融合，展现出前所未有的智能化与个性化。未来，我们有理由期待，语音识别不仅能够精准识别我们的语言，还能捕捉我们的情感，甚至预判我们的需求。