WDM과 응집성 선형 광학을 결합한 프로그래밍 가능한 광자 신경망

블로그

홈페이지홈페이지 / 블로그 / WDM과 응집성 선형 광학을 결합한 프로그래밍 가능한 광자 신경망

Aug 13, 2023

WDM과 응집성 선형 광학을 결합한 프로그래밍 가능한 광자 신경망

Scientific Reports 12권, 기사 번호: 5605(2022) 이 기사 인용 4884 액세스 19 인용 1 Altmetric Metrics 세부 정보 Neuromorphic photonics는 지금까지 coherent 또는 coherent에만 의존해 왔습니다.

Scientific Reports 12권, 기사 번호: 5605(2022) 이 기사 인용

4884 액세스

19 인용

1 알트메트릭

측정항목 세부정보

뉴로모픽 포토닉스는 지금까지 내적 또는 벡터별 곱셈을 가능하게 하기 위해 응집성 또는 WDM(파장 분할 다중화) 설계에만 의존해 왔으며 이로 인해 인상적인 다양한 아키텍처가 탄생했습니다. 여기에서는 한 단계 더 나아가 WDM을 사용하여 계산 목적을 제공하는 대신 팬인 및/또는 가중치 부여 단계 전반에 걸쳐 병렬화 기능으로 레이아웃을 강화하고 일관성 있는 광학과 WDM을 결합한 뉴런 아키텍처를 최초로 제시합니다. 다기능 프로그래밍 가능 신경망 플랫폼입니다. 당사의 재구성 가능한 플랫폼은 동일한 포토닉 하드웨어에 대해 4가지 다른 작동 모드를 수용하여 다층, 컨벌루션, 완전 연결 및 절전 레이어를 지원합니다. 우리는 중요한 광학 요소의 누화, 채널 간격 및 스펙트럼 의존성을 고려하여 4가지 작동 모드 모두에서 성공적인 성능을 수학적으로 검증하여 MAC 상대 오류 \(< 2\%\)로 안정적인 작동을 결론지었습니다.

인공 지능(AI) 및 딥 러닝(DL)의 폭발적인 성장과 성숙한 광자 통합으로 인해 계산 작업에서 광학을 사용할 수 있는 새로운 기회가 창출되었습니다1,2,3,4,5. NN(신경망) 하드웨어에서 광자 및 관련 광학 기술을 사용하면 해당 NN 전자 플랫폼에 비해 초당 MAC(Multiply-Accumulate) 작업이 크게 향상될 것으로 예상되며, 계산 에너지 및 영역 효율성은 다음과 같이 예상됩니다. < fJ/MAC 및 > TMAC/s/mm\(^{2}\), 각각6,7. 이러한 NN 하드웨어 패러다임 전환을 실현하기 위한 경로는 칩 규모에서 제공할 수 있는 소형 및 저전력 가중치 기능과 함께 통합 광자 기술이 지원하는 높은 회선 속도를 활용하는 것을 목표로 합니다4,8. 지금까지 가중치 부여 목적으로 활용되는 대부분의 광자 장치는 열광학(T/O) 위상 천이기9,10 및 PCM(상변화 물질) 기반 비휘발성 메모리 구조4,8와 같이 천천히 재구성 가능한 요소에 중점을 두었습니다. 이는 추론 응용 프로그램이 현재 뉴로모픽 포토닉스3 영역 내에서 주요 대상으로 간주된다는 것을 의미합니다.

추론 엔진에는 실제로 특정 AI 작업을 최적으로 수행하기 위해 정의되는 다소 정적인 뉴런 아키텍처와 계층 연결 그래프가 필요합니다. 예를 들어 객체 추적 및 이미지 분류는 일반적으로 여러 컨볼루셔널 레이어와 하나 이상의 FC(완전 연결) 레이어를 통해 수행되는 반면, 자동 인코더에는 FC 레이어의 계단식 단계가 필요합니다11,12. 컨벌루션 및 FC 레이어는 거의 모든 추론 플랫폼에서 중요한 아키텍처 요소를 구성하지만 레이어 수 및/또는 레이어당 뉴런 및 연결 그래프와 같은 대규모 매개변수 세트는 대상 DL 아키텍처 및 애플리케이션에 따라 크게 달라질 수 있습니다. 전자적 구현은 특정 추론 작업에 맞게 맞춤화된 ASIC(Application-Specific Integrated Circuit)로 결론을 내릴 수 있지만, 여러 애플리케이션에 동일한 하드웨어를 활용하기 위해 재프로그래밍 및 재구성이 필요한 경우 GPU, TPU 또는 심지어 FPGA의 사용이 불가피해집니다13.

재구성 기능을 Photonic(P)-NN 구현으로 이전하려면 동일한 신경 하드웨어에서 다양한 기능 레이아웃을 유연하게 지원할 수 있는 플랫폼이 필요합니다. 포토닉스의 프로그래밍 가능성은 지난 몇 년 동안 상당한 진전을 이루었으며14,15,16 프로그래밍 가능한 광자 집적 회로(PIC)는 다음과 같은 개념을 밀접하게 따를 수 있는 비용 효율적이고 유연하며 다기능적인 포토닉 플랫폼을 출시하는 데 중요한 이점을 제공하는 것으로 나타났습니다. 전자 FPGA17. 이러한 노력의 일환으로 적절한 아키텍처 체계 내에서 천천히 재구성 가능한 \(2 \times 2\) Mach-Zehnder 간섭계(MZI) 스위치를 사용하는 것만으로도 다양한 회로 연결 및 기능 옵션을 얻을 수 있다는 점도 강조되었습니다14,15 . 그러나 NN 아키텍처의 특이성은 현재 프로그래밍 가능한 포토닉 구현에서 아직 제공되지 않는 대체 기능을 따라 진행되어야 합니다. 최첨단 광자 가중치 기술4,8,9,10을 통해 가중치 값 재구성이 실제로 제공될 수 있고 프로그래밍 가능한 활성화 함수에 대한 관점의 전환도 나타나기 시작했지만16,18,19 뉴로모픽 광자 아키텍처는 지금까지 입증되었습니다. 선형 뉴런 단계에 대한 재구성 메커니즘을 지원하지 않습니다. PNN은 지금까지 WDM(Wavelength-Division-Multiplexed) 및 일관성 있는 플랫폼이 이산 및 병렬 로드맵을 따르는 것처럼 보이는 선형 신경 계층을 실현하기 위한 두 가지 주요 아키텍처 범주를 따라 발전해 왔습니다. 동일한 뉴런3,4,20 내의 각 축삭에 사용되며, (ii) 단일 파장이 전체 뉴런에 걸쳐 활용되어 가중 합 연산을 위해 일관된 전기장 간의 간섭을 활용하는 응집성 간섭계 방식입니다9,10.

4\) and \(N>2\) is imposed, respectively). Index n in the implementation (a) is set to \(n \le 4\) to denote that the lit nth branch carries a non-zero input. Similarly, if the number of available wavelengths M exceeds the number of required ones, the excess LDs are powered off./p> 90\%\) of analyzed random sets./p>