近期,亿欧·TE产服组织的“疆界——2023 AIGC技术应用创新峰会”上,北京市科委、中关村管理委员会、中国国际科技促进会元宇宙委员会作为指导单位,共同探讨了AIGC领域的前沿动态与挑战。会中,「AIGC应用场景创新Top 50」榜单公布,标贝科技因其领先的人工智能技术创新及应用实力,成功入选。
峰会以多维应用场景为出发点,汇聚了人工智能领域的领导者和垂直领域专家,分享了AIGC技术及其应用的最新进展。过去几年间,AIGC已广泛应用于音乐、视频、音频、数字人、游戏等领域,尤其是在2月,ChatGPT的惊艳体验再次引爆了AIGC话题。该技术超越传统弱人工智能,显著提升了AI内容创造能力,使用户对AI技术有了全新的认知。AIGC作为新兴生产力工具,正引领内容生成进入从专业生产(PGC)、用户自创(UGC)向人工智能生成(AIGC)的转变,成为互联网内容生产的基石。据《中国AI数字商业展望2021-2025》报告预测,到2025年,中国生成式AI技术应用市场规模预计将达到2070亿元,年均复合增长率高达84%。
当前,AIGC应用主要以自然语言输入为基础,生成包括文本、代码、图像、语音、视频、3D模型及音乐在内的多种数据形式。语音生成技术已发展成熟,广泛应用于日常及生产领域。除了常见的车载导航、语音播报、客户服务、有声阅读及内容配音等通用场景,AIGC正在拓展至语音克隆、音色定制等细分领域。
相较于传统的人声配音,基于AI的语音合成(TTS)技术能快速匹配特定场景的音色,大幅提升音频内容的生产效率。依据文本即时变换语调的情感化语音生成效果,使配音质量媲美真人。
作为AIGC行业的先行者,标贝科技专注于语音交互技术的研发与产业实践。依托于语音大模型迁移学习、深度神经网络(Transformer和GAN)技术,标贝科技构建了特色语音定制方案,提供丰富的音色选择、风格定制及合成效果支持,涵盖普通复刻、高级复刻和标准化音色定制等服务。这些技术在多个行业得以实际应用。
举例而言,标贝科技与领先的数智虚拟人服务商幻影未来合作,推出了AI数智人产品“幻真”,通过标贝科技的语音合成技术,实现了流畅自然的人机语音交互体验,服务于游戏互动、产品演示、活动介绍、知识问答等场景。此外,标贝科技还为人民日报定制了新媒体音视频解决方案,提供个性化的新闻男、女音色,有效降低了音视频内容制作成本,解决了音频新闻的时效性问题。
未来,随着算法、模型和计算能力的持续优化,AIGC生成的内容类型将更加丰富多样,质量也将不断提升,推动更多行业场景与技术创新。标贝科技将持续探索AIGC与垂直场景的融合,深化在合成声音深度产品体验方面的布局,通过技术迭代与产品进化,提升语言的迁移能力和情感表现力,构建千人千面的个性化声音定制平台,赋能媒体、金融、教育、文旅等行业的内容创作与生产。