据权威光学期刊《Optica》报道,斯坦福大学的研究团队已成功证明,可以直接在光学芯片上训练人工神经网络。这一重大进展表明,光学电路可以替代电子设备,实现关键的人工神经网络功能,从而以更低的成本、更快的速度和更高的能效完成语音识别、图像识别等复杂任务。
斯坦福大学研究团队负责人范汕洄表示:“与使用数字计算机相比,利用光学芯片进行神经网络计算更为高效,能够处理更加复杂的问题。”他补充道:“这将极大地提升人工神经网络的能力,例如使它们能够执行自动驾驶汽车所需的任务,或是更好地处理口语问题。这些进步将以我们目前难以想象的方式改善我们的生活。”
人工神经网络是一种模仿人脑处理信息方式的人工智能系统,其训练过程涉及大量算法对输入数据进行分类。尽管光学神经网络的实验已取得一定成果,但之前的研究大多依赖于传统的数字计算机进行训练,然后将训练好的设置转移到光学电路中。而在最新的《Optica》期刊中,斯坦福大学的研究团队介绍了一种全新的方法,即直接在设备内部训练人工神经网络,通过光学模拟实现“反向传播”算法,这是训练传统神经网络的标准方法。
第一作者泰勒·休斯指出:“使用物理设备而非计算机模型进行训练,可以提高训练的精确度。”他还提到:“由于训练步骤是神经网络实现中最耗计算资源的一部分,因此在光学电路上执行此步骤,对于提升人工神经网络的计算效率、速度和能耗至关重要。”
光学网络的优势 尽管神经网络的处理通常依赖传统计算机,但专门设计用于神经网络计算优化的硬件仍需大量研发。基于光学的设备因其并行计算能力和较低的能量消耗而备受青睐。
在本次研究中,研究人员设计了一种光学芯片,以复制传统计算机训练神经网络的方式,解决了实现全光学神经网络的重大难题。人工神经网络可以被视为一个带有众多调节旋钮的黑盒,在训练过程中,每个旋钮都需要微调,以测试系统的性能是否有所改善。
休斯解释道:“我们的方法不仅能预测旋钮的转动方向,还能并行地确定每个旋钮的最佳调整方向,从而显著加快训练速度,尤其适用于大型网络。”
芯片上的训练 这项新的训练协议在具有可调光束分离器的光学电路中运行,通过改变光学移相器的设置来实现。具体而言,该方法涉及将携带待处理信息的激光束输入到光学电路中,通过光波导和光束分离器进行传输,类似于调节旋钮,以训练神经网络算法。
在训练过程中,激光信号首先被送入光学电路,离开设备后,计算出与预期结果的偏差。随后,这些信息被用来生成一个新的光信号,反向发送回光网络。通过测量此过程中每个分束器周围的光强度,研究人员展示了如何并行地检测神经网络的性能随着每个分束器设置的变化情况。根据这些信息调整移相器的设置,此过程可以重复进行,直至神经网络达到预期的效果。
研究人员采用光学模拟验证了他们的训练技术,成功教会算法执行诸如识别复杂特征等复杂的任务。范汕洄表示:“我们的研究表明,可以利用物理定律来实现计算机科学算法。通过在光学领域对这些网络进行训练,证明了光学神经网络系统可以利用光学元件实现某些功能。”
未来,研究团队计划继续优化该系统,并探索其实现实际应用的可能性。他们设计的方法具有广泛的应用前景,不仅适用于多种神经网络架构,还可能应用于其他领域。