ChatGPT作为人工神经网络的衍生产品,在2023年火了,打破了科技产品用户过亿的最短时间记录。它是一种基于机器学习(深度学习)的大规模语言模型,其中从大量输入文本中学习语言规则起着重要作用。
通过预训练,ChatGPT可以完成文本翻译、图像识别、自然语言理解等各种任务。与电子学相比,光子在功率效率、并行性(计算能力)和最小延迟方面具有巨大优势;因此,光学神经网络(ONNs)最近被广泛用于实现更有效的机器学习。
网络中的信息是由光的空间、波长、振幅和相位等不同的物理维度承载的。轨道角动量(OAM)作为光的独特维数,由于轨道角动量态的无限正交性,已广泛应用于光通信、数字螺旋成像和量子通信等光学信息处理系统中,以增强信息容量。然而,由于缺乏在OAM域中提取信息特征的能力,它从未在onn中用于表示信息。
在《光:科学与应用》杂志上发表的一篇新论文中,由上海理工大学光子芯片研究所顾敏教授和方鑫源教授领导的一组科学家利用OAM介导的机器学习协议开发了一种新的onNs架构,其中光子OAM作为神经网络节点的信号。
在OAM域中学习图像的数据特征,从而将图像高精度地智能编码为特定的一种或几种OAM状态。图像的智能OAM编码可以配合不同的OAM检测/解复用设备完成图像分类、高吞吐量、低延迟的自由空间安全图像传输、光学异常检测等各种OAM信息处理任务。
在OAM域中学习图像数据特征的实现是基于衍射卷积神经网络(CNN)的,该网络主要由两部分组成。第一部分是卷积部分,利用图像的OAM模式频谱与可训练的OAM模式色散脉冲之间的卷积,对输入的OAM模式梳进行密集化并提取模式特征。
第二部分是由级联的有限孔径可训练衍射层组成的分类块,可以实现模式特征压缩。即通过各种OAM模式的不同衍射损耗来控制宽的OAM频谱分布(其中已经包含了图像的模式特征),最终输出特定的一种或几种OAM状态,实现模式特征OAM编码。衍射层的模式色散脉冲和相位分布通常是通过多任务学习来训练的,目标是所需的输出OAM模式。
科学家们总结了他们的CNN的工作原理,“将图像空间域的输入原始数据转换为OAM域,以表示多个OAM模式梳。”但在这些OAM模式梳中,大多数非零振幅系数项集中在低阶OAM模式分量上,这表明了具有潜在共性的稀疏OAM信息特征。这是提取OAM特征信息的主要难点。
“受CNN通过在分类前插入基于卷积的特征提取块来提高预测精度的启发,我们在OAM域中构建了一个CNN来克服精确提取OAM特征的问题。因此,CNN将输入数据的原始形式的OAM特征提取出来后,可以大大降低高维数据(如图像)的参数复杂度。”
他们测试了他们的智能模式特征OAM编码,并将10种手写数字(在MNIST数据库中)区分为10种单独的OAM模式。分类准确率达到96%。这种编码技术也被引入到无线光通信系统中。该团队将三种类型的t恤、裤子和短靴的图像(在Fashion-MNIST数据库中)编码为三种最强的权重OAM模式,信息传输的准确率为93.3%。
他们发现这种编码方法具有极高的抗窃听能力,因为窃听器(相对于通信接收器)固有的横向偏移会直接导致OAM模式测量不准确(窃听失败)。他们进一步将模式特征的OAM编码与OAM复用全息图作为解码系统相结合,展示了端到端可切换的图像显示,这是一种具有所有光学信息编码、传输和显示的无线通信。
此外,他们还验证了图像的全光学降维在异常检测中的作用。在该函数中,分别使用“BUS”图像和“SUV”图像来训练CNN,以实现叠加OAM模式状态分布的特定输出。有趣的是,当异常图像(其他不属于这两类的图)输入到网络时,它们占据不同的OAM模式分布,分别是“BUS”和“SUV”两种分布,因此可以用异常标签找到它们。
在讨论该技术的物理意义和未来发展时,科学家们观察到:“我们提出了一种通过全光学机器学习将数据特征转换为OAM状态的通用机制,可以实现OAM维度中任何信息的自由转换。它为以光速对特定数据库和图像进行智能OAM编码打开了新的大门,打破了OAM领域光学降维的瓶颈,有望在未来用于各种机器视觉任务的高容量、高安全性光神经网络领域发挥巨大作用。”
更多信息:方鑫源等,轨道角动量介导的高精度模式特征编码机器学习,Light: Science & Applications(2024)。DOI: 10.1038/s41377-024-01386-5中科院长春光学精密机械与物理研究所光出版中心提供引文:轨道角动量中介机器学习高精度模式特征编码(2024年2月20日)检索自2024年2月22日https://techxplore.com/news/2024-02-orbital-angular-momentum-machine-high.html除为私人学习或研究目的而进行的任何公平交易外,未经书面许可,不得转载任何部分。内容仅供参考之用。