用于物体分类任务的轨道-角动量编码衍射网络
发布时间:2023-11-28 10:59:30 阅读数: 23
所提出的衍射深度神经网络采用轨道角动量编码和衍射层来处理手写数字的空间信息,为单位和多位数识别提供了鲁棒和通用的方法。资料来源:Advanced Photonics Nexus(2023)。apn.2.6.066006 DOI: 10.1117/1.
深度学习彻底改变了我们感知和利用数据的方式。然而,随着数据集的增长和计算需求的增加,我们需要更高效的方法来处理、存储和处理数据。在这方面,光学计算被视为计算技术的下一个前沿。光学计算不使用电子信号,而是依靠光波的特性(如波长和偏振)来存储和处理数据。
衍射深度神经网络(D2NN)利用光波的各种特性来执行图像和物体识别等任务。这种网络由作为衍射层的二维像素阵列组成。每个像素都是一个可调参数,会影响穿过它的光波的特性。这种独特的设计使网络能够通过处理光波中的信息来执行计算任务。迄今为止,D2NN 已利用了光波的特性,如强度、相位、偏振和波长。现在,来自中国民族大学、北京大学和山西大学的研究人员在《Advanced Photonics Nexus》杂志上发表的一项研究中,开发出了三种带有衍射层的 D2NN,可以利用光的轨道角动量(OAM)信息识别物体。其中包括用于单任务和多任务分类的单探测器 OAM 编码 D2NN,以及用于可重复多任务分类的多探测器 OAM 编码 D2NN。
但什么是 OAM?它是光波的一种特性,与光波的旋转或扭转运动有关。它可以有无数个独立的值,每个值对应不同的光模式。由于其可能的状态或模式范围很广,OAM 可以携带空间信息,如物体的位置、排列或结构。在提议的 D2NN 框架中,包含手写数字信息的 OAM 光束被组合成一个单一的涡流光束。该光束包含多个OAM模式,每个模式都与光波的特定扭曲或旋转相关联,通过五个衍射层,以识别OAM模式中手写数字的特征。OAM 编码 D2NN 的一个显著特点是能够辨别重复数字的序列。为此,研究人员采用了多个探测器来同时处理多个图像的 OAM 信息。在常用于手写数字识别的 MNIST 数据集上进行测试时,D2NN 在大约85.49% 的时间内正确预测了图像中的单个数字,其准确率与利用光的波长和偏振特性的 D2NN 模型相当。
利用 OAM 模式对信息进行编码是提高并行处理能力的重要一步,将使需要实时处理的应用(如图像识别或数据密集型任务)受益匪浅。实际上,这项工作通过利用 OAM 自由度实现了并行分类的突破,超越了其他现有的 D2NN 设计。值得注意的是,OAM 编码 D2NN 为进一步提高全光并行分类和基于 OAM 的机器视觉任务的能力提供了一个强大的框架,有望为 D2NN 开辟前景广阔的研究方向。