炬芯科技周正宇:焕新声音活力,AI驱动下的音频芯片创新

图灵汇官网

人类声音感知的重要性及其对现代技术的影响

声音在人类交流和感知世界中扮演着核心角色,甚至在某种程度上超越了视觉的作用。正如海伦·凯勒所言,“盲隔绝了人与物,聋隔绝了人与人”,这揭示了声音在人际互动中的不可或缺性。从生命之初到生命终结,耳朵作为永不关闭的感知器官,每时每刻捕捉并传递环境中的声音至大脑,使其成为人工智能时代人机交互的重要媒介。

随着科技的进步,人类对声音质量的追求不断深化,从早期的留声机到现代的TWS耳机,这一过程见证了人们对高品质音频体验的不懈追求。伴随这一进程,人们对音频产品的便携性、小型化和长续航的需求日益增长,同时,音频产品在不同历史时期引领着时尚潮流,成为社会变迁的见证者。

苹果公司的iPod和AirPods等产品,不仅革新了MP3便携音频体验,还引领了TWS耳机的风潮,充分体现了音频产品在技术创新方面的巨大潜力。智能音箱,如亚马逊Alexa的问世,开创了人机语音互动的新纪元,预示着AI时代音频产品的巨大影响力。

炬芯科技股份有限公司的周正宇博士在ICCAD2023会议上,深入探讨了音频领域的发展趋势及AI时代背景下的创新策略。他特别强调了在低功耗环境下打造高算力的紧迫性和必要性,这是便携式AI音频SoC的核心挑战与机遇。

AI驱动下的音频芯片创新

面对便携式音频设备的AI化挑战,实现单位毫瓦功耗下的算力最大化成为关键。在电池供电的约束下,打造更大算力的核心诉求是在低功耗状态下提供更强大的AI体验。计算架构和芯片电路的创新成为了实现这一目标的关键。

以TWS耳机和智能手表为例,这类产品通常采用4.2V锂电池供电,其典型完整功能SoC平均工作电流在3-5mA,意味着整体功耗总预算应在15-20mW以下。在电池技术未发生革命性变革的前提下,便携式音频或穿戴产品SoC应以不超过10mW的功耗预算打造更大算力。

AI音频模型的算力需求通常在1TOPS以下,典型算力范围在200-500GOPS,这意味着要在10mW以下的功耗预算内打造200-500GOPS的AI算力。这一目标的实现,要求在传统冯诺依曼计算架构的基础上进行重大创新。

存内计算(CIM)的潜力

存内计算(CIM)作为一种具有潜力的技术路径,通过在存储单元上实现计算,实现了存算融合,极大地提升了计算能效。基于SRAM的CIM在能效比、写次数限制、工艺成熟度和可集成性等方面具有显著优势,使其成为打造低功耗音频AI算力的理想选择。

基于MMSCIM(Mixed-Mode SRAM based CIM)技术路径,炬芯科技的最新成果有望在22nm工艺下实现7.8TOPS/W的能效比,进一步在16nm工艺下提升至15.6TOPS/W,尽管如此,仍需在能效比上做出更多创新。

焰芯科技的最新成果

炬芯科技即将推出的ATS286X系列高端AI音频芯片,正是基于MMSCIM技术的最新成果。这款芯片旨在为AI降噪、人声分离、人声隔离等应用场景提供高品质提升,预期在2024年正式发布,将为智能音频、智能办公、智能教育、智能陪护等领域带来革命性变化。

结论

音频AI化的趋势将持续推动芯片技术的创新,特别是SoC技术的革新,而实现这一目标的关键在于如何在便携式产品中实现低功耗下的高算力。炬芯科技的前瞻性布局和技术创新,展示了国产端侧AI音频芯片的巨大市场潜力,预示着这一领域将迎来蓬勃发展的新阶段。

本文来源: 图灵汇 文章作者: 汪红羽