微软携手 Project Gutenberg，利用 AI 制作 5000 本免费有声书

投稿
APP
微信扫一扫获取更多

微软携手 Project Gutenberg，利用 AI 制作 5000 本免费有声书

西洛

2023-09-12 13:00:36

图灵汇官网

摘要：

近期，微软与Project Gutenberg携手，运用AI技术为电子书库打造了超过5000本免费有声书。此合作旨在利用先进的人工智能，包括机器学习、自动文本选择及自然语音合成，将电子书籍转换为音频内容。

详细内容：

微软与Project Gutenberg的合作，标志着一项创新的AI应用实践。双方共同致力于将大量的电子书籍转化为可听形式，为全球读者提供了丰富而便捷的阅读体验。项目中，研究团队融合了多种AI技术，如机器学习、自动文本识别以及自然语音合成，实现了电子书籍到语音的高效转换。

项目的核心在于开发一套算法，该算法能精准解析电子书籍的结构，自动识别文本内容与辅助元素（如页码、表格）之间的差异。接着，借助WaveNet、Tacotron和FastSpeech等文本转语音技术，生成了接近人类发音的自然朗读语音。特别地，该系统具备辨别书中角色、对话和叙述的能力，并据此调整语音输出，确保故事的连贯性和情感表达。

微软透露，此项目累积了逾35000小时的有声书语音数据，覆盖了从经典文学到戏剧、传记等多样体裁的作品。这些资源将通过开源形式向公众开放，不仅丰富了有声书库的内容，也特别关注了视障人士的需求，提供个性化的阅读体验。用户甚至有机会利用自己的声音，生成专属的有声书版本，进一步增强了互动性和个性化。

此次合作不仅体现了技术创新在文化传承与普及方面的应用潜力，也为数字化时代的人文关怀提供了新的视角。通过这样的合作，微软与Project Gutenberg不仅推动了知识的无障碍传播，也为未来的AI应用开辟了更多可能。