基于频率梳的光学神经网络

光学小豆芽

发布于 2021-03-13 22:29:04

1.3K0

发布于 2021-03-13 22:29:04

文章被收录于专栏：硅光技术分享硅光技术分享

2021年伊始，Nature杂志在同一期上刊登了两篇光学神经网络的最新进展，标题分别是：

1) Parallel convolutional processing using an integrated photonic tensor core

2) 11 TOPS photonic convolutional accelerator for optical neural networks

小豆芽这里做一个简单的介绍与比较，供大家参考。

文献1中，采用光学频率梳(optical frequency comb)和相变材料(phase change material, 以下简称PCM)这两个核心技术，实现了并行的光学张量核(photonic tensor core)。整个系统的原理图如下图所示，

（图片来自文献1）

基于氮化硅微环波导的克尔效应，产生了孤子频率梳。每个波长的强度可以通过VOA单独调节，这样实现了对输入矢量的编码。接着将这些不同频率的光波输入到含有PCM的SiN光芯片中(关于PCM的原理，可参看光芯片上的全光脉冲神经网络)。Kernel矩阵的矩阵元通过PCM进行编辑，当光经过相应的光路时，信号强度会进行不同程度的改变，从而完成标量积的运算。最终不同波长的光信号在片外进行分离(DeMux)并转换成电信号，完成矩阵的乘加计算。

整个系统的光路图如下图所示，

（图片来自文献1）

实验中共使用了16组波长，波长间隔为100GHz。每四个波长为一组，通过Mux合束，然后从同一个耦合器耦入到相同的通道中。Weight矩阵的规模最高可以达到16x16, 可以根据情况选取合适的矩阵大小。实验中，对于MNIST手写数字的识别，他们采用四个2x2的Kernel矩阵，对应4x4的矩阵。对于矩阵元的设置，通过下述的结构实现，

采用耦合长度为10um的定向耦合器，其分光比为50/50。当光经过含PCM的波导(上图中的绿色区域)，通过调节PCM材料的状态(非晶态/晶态)，可实现对光场强度的调节。

其光学耦合器采用了3D打印的聚合物结构(PWB, photonic wire bonding)，比较有意思，如下图所示，实现了对宽波导波长的高效率耦合。

整个系统对MNIST数据集单张图片的处理时间为8.1us, 预测准确率为95.3%。这一指标与电学的商用芯片比，还是存在一定的差距，如下图所示，

文献2中采用了类似的光学频率梳，但是不同波长携带的信号对应于Kernel矩阵。而将输入的矢量信号编码于时域的电信号上，通过电光调制器将电信号加载到光信号上，采用时间和频率两个维度的编码，最终完成对卷积神经网络的计算。其原理图如下图所示，

（图片来自文献2）

整个系统如下图所示，

（图片来自文献2）

采用10个3x3的Kernel矩阵，因此对应90个波长。波长间隔为48.9GHz，每个波长的强度通过wave shaper进行调节。输入的图片像素大小为500x500, 转换成250000*1的矢量，信号加载到光域之后，通过2.2km长的单模光纤，这样不同波长的信号在时域上将产出15.9ps的时间间隔，然后对同一时刻的光信号进行相加，即可得到矩阵计算的结果。下图是四个波长信号相加的示意图，横轴为时间维度，纵轴为波长维度。每一行的数据对应同一波长不同时刻的数据，将特定列的信号相加，即可得到所需的矩阵乘加计算结果。

需要注意的是，在探测器端，探测的是不同波长的强度和，并没有像文献1中，针对不同波长进行探测。

该系统的处理速率达到11TOPS, MNIST数据集的预测准确率为88%。

简单整理总结一下，

1）同一期发表相同领域的两篇进展，可见该领域的火热。科技界开始重视光学神经网络这一领域，越来越多的新鲜血液加入到这个方向的研究中，各显神通。微信讨论群里也有不少攻读这个方向的研究僧。

2）两篇文章都将目光投入了波长这个维度，利用不同波长实现对信号的并行处理，发挥光信号处理的独特优势。并且都采用了相似的光学频率梳，区别在于是一个用作输入信号的编码，一个用于Kernel矩阵元的编码。

3）文献一使用PCM进行矩阵元的编码，更强调芯片化，文献二采用的是分立光学的方案，并且使用了时间这一维度。

4）两篇进展都演示了对MNIST手写数字数据集的处理，准确率都比较高，处理速度也非常快。但是和目前的商用AI芯片比，还存在一定的差距。能否产业化，还存在很多技术难题。

5）与最早的基于MZI网络的相干方案(基于硅光芯片的深度学习)相比，这两篇报道本质上都可以算作非相干方案的范畴，侧重于对强度的调节。相干与非相干方案谁更具有优势，现在似乎还没有定论。

6）无论是哪种方案，最终都会涉及到光电信号之间的相互转换，但是似乎两篇文献都没有强调这一部分。有可能这些器件会成为整个系统的瓶颈或者短板。

文章中如果有任何错误和不严谨之处，还望大家不吝指出，欢迎大家留言讨论。也欢迎大家向我提问，小豆芽会尽自己的能力给出解释。另外，微信讨论3群还有空位，有需要的朋友可以加入进来讨论硅光技术。大家也可以添加我的个人微信photon_walker。

参考文献：

J. Feldmann, et.al., "Parallel convolutional processing using an integrated photonic tensor core", Nature 589, 52(2021)
X. Xu, et.al., "11 TOPS photonic convolutional accelerator for optical neural networks", Nature 589, 54(2021)

本文参与?腾讯云自媒体分享计划，分享自微信公众号。

原始发表：2021-02-21，如有侵权请联系?cloudcommunity@tencent.com 删除

kernel