微软携手 Project Gutenberg,利用 AI 制作 5000 本免费有声书

图灵汇官网

摘要:

近期,微软与Project Gutenberg携手,运用AI技术为电子书库打造了超过5000本免费有声书。此合作旨在利用先进的人工智能,包括机器学习、自动文本选择及自然语音合成,将电子书籍转换为音频内容。

详细内容:

微软与Project Gutenberg的合作,标志着一项创新的AI应用实践。双方共同致力于将大量的电子书籍转化为可听形式,为全球读者提供了丰富而便捷的阅读体验。项目中,研究团队融合了多种AI技术,如机器学习、自动文本识别以及自然语音合成,实现了电子书籍到语音的高效转换。

项目的核心在于开发一套算法,该算法能精准解析电子书籍的结构,自动识别文本内容与辅助元素(如页码、表格)之间的差异。接着,借助WaveNet、Tacotron和FastSpeech等文本转语音技术,生成了接近人类发音的自然朗读语音。特别地,该系统具备辨别书中角色、对话和叙述的能力,并据此调整语音输出,确保故事的连贯性和情感表达。

微软透露,此项目累积了逾35000小时的有声书语音数据,覆盖了从经典文学到戏剧、传记等多样体裁的作品。这些资源将通过开源形式向公众开放,不仅丰富了有声书库的内容,也特别关注了视障人士的需求,提供个性化的阅读体验。用户甚至有机会利用自己的声音,生成专属的有声书版本,进一步增强了互动性和个性化。

此次合作不仅体现了技术创新在文化传承与普及方面的应用潜力,也为数字化时代的人文关怀提供了新的视角。通过这样的合作,微软与Project Gutenberg不仅推动了知识的无障碍传播,也为未来的AI应用开辟了更多可能。

本文来源: 图灵汇 文章作者: 西洛
    下一篇

每经记者:于峰每经编辑:杨夏 在9月15日举行的2023世界计算大会上,华为技术有限公司轮值董事长徐直军在谈到构建我国计算产业时建议,第一是共建鹏腾生态,促进通用计算产业的可持续发展;第二是共建腾生态,促进AI计算产业的可持续发展;第三以集群和云服