閱讀 | 訂閱
閱讀 | 訂閱
今日要聞

AI正在重塑光子器件領域

fun88网页下载 來源:科普中國2025-08-06 我要評論(0 )   

隨著大數據、物聯網以及 5G 係統應用的日益廣泛,數據傳(chuan) 輸的速度和容量需求急劇增加,矽基電子集成芯片的尺度和計算效率逐漸趨近物理極限。而光子集成芯片以光子為(wei) 信息...

隨著大數據、物聯網以及 5G 係統應用的日益廣泛,數據傳(chuan) 輸的速度和容量需求急劇增加,矽基電子集成芯片的尺度和計算效率逐漸趨近物理極限。而光子集成芯片以光子為(wei) 信息載體(ti) ,具有體(ti) 積小、速度快、集成度高的優(you) 勢,在光通訊、量子計算、量子信息處理等領域得到了快速發展。

我們(men) 可以把光子比作火車,把光子器件比作火車軌道和火車站,光子在光子芯片中傳(chuan) 輸、處理,就像是火車在鐵軌上行走,並在火車站裏實現人員的交換(信號的處理)。

波導是光子芯片器件中最基礎的單元之一,其主要功能是引導光沿著特定路徑傳(chuan) 輸。光子器件中的波導類似於(yu) 我們(men) 常見的光纖,可以對光實現有效束縛。除此之外,利用波導還可以製備多種常見的光功能器件。比如,圖 1a 所示的是一種定向耦合器(Directional Coupler,DC),通常是由兩(liang) 根波導構成的光子器件,當光在其中一根波導傳(chuan) 輸時,在某些特定的情況下,光並非完全局域在波導內(nei) ,有一部分會(hui) 貼在波導外表麵(電磁波的倏逝場效應),如果另一根波導和這根波導靠的很近,那麽(me) 這些光就可以進入另一根波導(也就是耦合效應)。通常,光信號在兩(liang) 根波導之間的傳(chuan) 輸具有明確的方向性,因此這種結構被稱作定向耦合器。通過對第二根波導光信號進行分析、處理等,實現特定的功能。圖 1b 紅色虛線區域所示的光子器件叫做馬赫曾德爾幹涉儀(yi) (Mach-Zehnder Interferometer, MZI),也是由兩(liang) 根波導組成,隻不過這兩(liang) 個(ge) 波導裏的光都是從(cong) 同一端輸入的,不同的是,在這種結構中,通過對下麵的波導進行一定的調製(通常是加電),利用電光效應(改變折射率)可以改變傳(chuan) 輸光的相位,讓上下兩(liang) 束光產(chan) 生相位差,進而產(chan) 生幹涉來調節輸出端口光信號的強度,廣泛用於(yu) 相位調製、光強度調製和光偏振調製等領域。

圖1:比較常見的幾種光子器件 a定向耦合器[1];b馬赫曾德爾幹涉儀(yi) [2]

超表麵(metasurface)則是另一類波導器件,其由排列在二維平麵的納米結構單元組成,每一個(ge) 結構單元像一個(ge) 個(ge) 微型“光學天線”一樣,能夠在納米尺度上精確調節光的相位、振幅和偏振狀態。通過對這些結構的巧妙設計,科學家們(men) 可以讓光按照預設的方式折射、反射、聚焦,甚至改變顏色、亮度或者傳(chuan) 播方向,就像給光裝上了“指揮棒”。比如,2011 年美國科學家 Capasso 團隊所提出了一種 V 形天線結構的超表麵(圖 2a),可以實現電磁波傳(chuan) 輸異常的偏折(圖2b,藍色線段表示正常反射和折射路徑,紅色線段表示異常反射和折射路徑)。

圖 2:基於(yu) V 形天線結構的超表麵結構[3]

在這些光子器件中,結構的幾何參數和外部調控參數,例如波導寬度、耦合區域長度、波導間間距、外加電信號強度等都會(hui) 產(chan) 生不同的功能。在設計此類光子器件時,需要根據實現的功能,找出特定的參數。因此,光子器件結構設計顯得尤為(wei) 重要。

像波導這樣的單個(ge) 器件設計起來相對容易一些,通過調控某幾個(ge) 參數,比如波導的幾何尺寸、材料類型等,往往就可以實現想要的功能。不過當這些光子器件集成在光芯片中時,比如超表麵結構就包含了多個(ge) 基本器件單元,不同基本單元之間的相對角度、距離、尺寸等都會(hui) 影響它們(men) 之間的耦合、相互作用,進一步加劇了設計難度。

為(wei) 了減少加工成本,不得不借助計算機技術在加工器件之前進行模擬仿真,可以減少實驗成本,也有利於(yu) 設計出功能較為(wei) 複雜的結構。例如,常用的數值模擬方法有時域有限差分法(Finite-Difference Time-Domain,FDTD)、有限元法(Finite Element Method,FEM)等。

盡管這類數值模擬的方法在光子器件設計中獲得了廣泛的應用,但仍存在一定的局限性。以 FDTD 為(wei) 例,在模擬時先把要將模擬的區域劃分出極小的網格,同時將光的傳(chuan) 播過程劃分成無數個(ge) 極短的瞬間。然後按照光的傳(chuan) 播規律(麥克斯韋方程),逐個(ge) 計算每個(ge) 網格在不同時刻的光場,最終將這些結果拚在一起,就可以得到光在器件裏傳(chuan) 輸時的完整過程了。受限於(yu) FDTD 數值方法的固有特性,在模擬光學器件時,單次計算區域的網格要小於(yu) 波長。這種超高分辨率的要求使得傳(chuan) 統方法在模擬大尺寸光子器件時就顯得力不從(cong) 心了。

此外,在設計實現某種特定功能的光子器件時,設計者通常隻能對某些特定的參數進行調整,例如耦合區域長度,波導寬度等。但實際影響器件性能的因素有很多,這種采用特定結構參數調整的方法大大限製了設計的自由度。對於(yu) 較為(wei) 複雜的器件,往往要通過嚐試大量不同參數組合以尋找最優(you) 解,計算成本和時間也隨參數的數量指數級增加,有時需要數天甚至數周才能完成一個(ge) 滿足使用要求的光子器件。比如,想要模擬波導幾何尺寸對光傳(chuan) 輸的影響,就要考慮波導的寬度、高度、長度三個(ge) 參量,如果每個(ge) 參量的變化是從(cong) 11 μm-20 μm,參量改變步長是 1 μm,每個(ge) 維度的可能性就是 10 種,三個(ge) 維度就是 1000 種,相當於(yu) 計算機要計算 1000 次才可以模擬完成。因此,上述方法一般可以設計的光子器件尺寸往往隻能在百微米量級。

總之,傳(chuan) 統方法不僅(jin) 會(hui) 消耗大量的計算資源,也會(hui) 在集成度上存在限製。

近年來,人工智能(Artificial Intelligence,AI)技術的迅速發展為(wei) 科學研究提供了新的契機。2024 年諾貝爾物理學獎、化學獎均頒發給 AI 領域的科學家。機器學習(xi) ,尤其是深度學習(xi) ,已被廣泛應用在微結構的高效率設計和結構優(you) 化等方麵,大大縮短了微結構的設計時間,同時也為(wei) 大麵積結構的設計提供了新的技術手段。

那麽(me) ,AI 是如何做到的呢?

首先,AI通過收集大量的特定光學結構的數據以及對應的光學性能,利用這些數據對深度學習(xi) 模型進行訓練。這就好比我們(men) 先讓模型學習(xi) 一本“字典”(稱為(wei) 正向模型網絡),將結構參數和光學性能對應起來。訓練完成後,模型就會(hui) 就會(hui) 變成一個(ge) 經驗豐(feng) 富的設計專(zhuan) 家。然後,給模型輸入特定的功能要求,模型會(hui) 在字典中查找類似的結構。當然這種結構還不能滿足要求,還需要通過對初始設計進行不斷優(you) 化(稱為(wei) 逆向設計模型網絡)。

為(wei) 了實現正向模型網絡對“結構→性能”精準映射和逆向設計模型網絡從(cong) “功能→結構”反推優(you) 化,科學家提出很多優(you) 化方法。這些方法中,梯度下降算法因為(wei) 簡單、高效,是目前應用最廣泛的一種。

這種方案就像我們(men) 在山頂尋找通往山穀的最短路徑。當你站在山頂上時,這時還不知道最佳的路徑,隻有一個(ge) 粗略的方向。如果是你,你會(hui) 怎麽(me) 做呢?

下山時,你需要通過當前的坡度來決(jue) 定下坡的方向。通常的方案是,你沿著坡度下降的方向不斷前進,每次都朝著最陡的方向走,才會(hui) 快速接近山穀(圖 3)。

圖 3:下山尋找最短路徑示意圖[4]

看到這裏,大家可以想一下,沿著梯度最大的方向行走,就一定會(hui) 達到山穀嗎?

實際上,如果走著走著遇到了一個(ge) 小窪地,無論往哪個(ge) 方向再邁一步,都是梯度增加的方向,模型以為(wei) 這就是山穀了,而事實並非如此。

這種遇到“假山穀”的情況就使得 AI 陷入“局部最小值”,而無法達到“全局最小值”。為(wei) 了避免這一問題,可以通過調節步伐大小、引入隨機擾動等方法,盡快讓 AI 跳出小窪地,找到“全局最小值”, 從(cong) 而到達山穀。

在設計光子器件時,一般是根據已有的知識或經驗設計一些可能的器件結構。此時,我們(men) 並不清楚哪些結構參數是最優(you) 的,光傳(chuan) 輸效率還比較低、損耗還比較大。當前結構的性能(如傳(chuan) 輸效率、光損耗、集成度等)相對於(yu) 各個(ge) 設計參數(如波導寬度、材料折射率等)的變化率為(wei) “梯度”,相當於(yu) 下山時的“坡度”。AI 通過計算不同參數對最終性能的影響,得出“梯度”。比如,從(cong) A 點出發,通過尋找附近最大的“梯度”,並沿著這一方向就可以走到 B 點,從(cong) 而降低目標函數(如損失函數)的值(圖 4)。這就像你在山中根據坡度來判斷下一步的方向。重複這個(ge) 步驟,逐步調整模型參數,使目標函數達到最小值,最終就能到達最低點 C 點。這個(ge) 過程幫助 AI 知道應該如何調整設計參數,使得光子器件的性能逐步提升。

圖 4:梯度下降算法示意圖[4]

同樣,在 AI 設計光子器件時,學習(xi) 率決(jue) 定了每次調整設計參數的步伐。如果學習(xi) 率太大,模型可能會(hui) 因為(wei) 調整過度而陷入不好的設計;如果學習(xi) 率太小,模型則會(hui) 慢慢收斂,效率低下或者陷入“局部最小值”。

總之,AI 在一個(ge) 龐大的設計空間中不斷進行優(you) 化。經過不斷的調整、優(you) 化,最終找到了最佳的參數。這時,AI 就像是你成功地從(cong) 山頂下到了山穀的最低點,找到了最合適的光子器件結構,使得光子器件的性能達到了最優(you) 。利用這種方法就可以根據我們(men) 的需求快速地設計相應的結構,大大縮短了設計時間並提高了設計的準確性,甚至可以設計出很多人類都無法想象的結構。

我們(men) 以超表麵結構為(wei) 例解釋 AI 是如何設計光子結構的。圖 5 展示的是一種尺度小於(yu) 波長、具有高品質因子的共振超表麵結構[5]。類似於(yu) 圖 2 的超表麵結構,這種超表麵結構也是由許多基本單元結構(圖 5 藍色結構)排列成的二維平麵結構。每個(ge) 基本單元由兩(liang) 個(ge) 相同的矽納米棒組成。高品質因子意味著光可以在這些結構中被強烈地“困住”而不向外輻射,使得光子可以停留更長的時間,大大增強光與(yu) 材料之間的相互作用效率。利用這種結構的共振特性,可以用於(yu) 光學傳(chuan) 感、非線性等領域。由於(yu) 結構的參數微小變化會(hui) 劇烈的影響共振光譜的特性,因此要想實現預定的功能,傳(chuan) 統的設計方法通過連續調節結構參數來模擬對應的性能。不過,這種方法往往隻能同時優(you) 化一兩(liang) 個(ge) 參數,並且參數優(you) 化的範圍和精度有限。而實際上對性能的調控需要同時對材料的屬性、幾何特性等多個(ge) 變量進行同時優(you) 化,因此傳(chuan) 統的方法對於(yu) 共振光譜的線寬、寬度等調控能力有限,並且非常耗時。

圖 5:一種矽納米棒超表麵結構示意圖[5]

為(wei) 了提高了結構設計的效率,科學家們(men) 首先利用人工神經網絡模型(神經網絡是人工智能的核心技術模型,概念源自於(yu) 人類大腦的神經元網絡)將一個(ge) 正向模型網絡(Pretrained forward model network)和一個(ge) 逆向設計模型網絡(Inverse-design model network)串聯起來(圖 6)。然後使用開源神經網絡庫對正向模型網絡進行訓練,學習(xi) 超表麵結構參數(圖 6 中右半部分的 y1,y2……)與(yu) 透射光譜(圖 6 中右半部分的 x1,x2……)的映射關(guan) 係(“字典”)。其次,逆向設計模型網絡的輸出(圖 6 中左半部分的 y1,y2……)接入已訓練好的正向模型網絡,通過學習(xi) 這本“字典”,就可以知道如何根據目標光學響應(圖 6 中右半部分的 x1,x2……)找到合適的超表麵結構參數。也就是利用這本“字典”來輔助逆向設計模型網絡完成從(cong) 光學響應到結構參數的預測。最後,逆向設計模型網絡根據光學目標預測結構參數,並通過比較正向網絡的輸出與(yu) 目標響應的誤差來更新自身參數使輸入結果與(yu) 預測結果的差異達到最小(即梯度下降算法),從(cong) 而預測出符合條件的超表麵結構參數,實現高效、準確的超表麵設計。

圖 6:由一個(ge) 逆向設計模型網絡和一個(ge) 預訓練的正向模型網絡連接而成的TN模型架構[5],其中,X表示輸入和輸出,即透射光譜數據,而Y表示中間層的輸出,對應的是結構參數。

通過輸入超表麵結構的透射光譜參數:工作波段λ=1500 nm,線寬(共振峰的半高寬)△λ=5 nm,形狀因子(用於(yu) 描述光譜的不對稱性)q=0.5(對應的光譜如圖 7 黑色虛線所示),最終,在固定基本單元周期 D=900 nm,納米棒厚度 150 nm 的情況下,神經網絡模型設計的納米棒長寬度 w=316 nm,長度 L=580 nm,每個(ge) 基本單元中兩(liang) 個(ge) 納米棒的間距 2x0=378 nm,該結構對應的透射光譜如圖 7 紅色實線所示。可以看出,模型預測結構的光譜和輸入光譜(目標結果)非常接近。

圖 7:輸入透射光譜(黑色虛線)和神經網絡模型預測結構的透射光譜(紅色實線)比較[5]

如果利用傳(chuan) 統的數值模擬方法,需要專(zhuan) 業(ye) 的計算機,並且至少花費秒量級的時間。基於(yu) 這種方法,利用普通的計算機(Intel(R) Core(TM) i7-4770 CPU @ 3.40 GHz, RAM: 16.0 GB)在 0.05s 的時間就完成了光學超表麵結構設計,設計效率得到了顯著提升。

人工智能除了科研輔助研究人員用於(yu) 光子結構設計,研究人員發現利用光子芯片還可以用於(yu) 實現神經網絡的光子結構。相較於(yu) 傳(chuan) 統的電子芯片,光子神經網絡在計算速度與(yu) 功耗上具有明顯優(you) 勢。比如,2022 年 Firooz 等人實現了一個(ge) 利用片上光子深度神經網絡來實現對手寫(xie) 字母識別的係統(圖 8)。研究團隊將手寫(xie) 字母圖像每個(ge) 像素點的光強信息通過光柵耦合器輸入到係統中。通過對輸入信號進行加權處理(Optical attenuator部分,光學衰減器),然後光進入光電探測器(PD 部分)完成加法運算,接著由微環諧振器(Optical modulator 部分)實現非線性變換(複雜特征提取),最終將光信號傳(chuan) 遞到下一層神經網絡(Neuron optical output)。

圖 8:利用光子芯片識別手寫(xie) 字母[6]

這些成果展示了人工智能在光子器件中的巨大應用潛力,為(wei) 開發新一代高效、功能豐(feng) 富的光子器件打下了基礎。我們(men) 相信,隨著人工智能技術的迅速發展,微納光子器件設計與(yu) 應用領域將迎來一場巨大的技術變革。在不久的將來,現在所用的電子設備也許都會(hui) 變成光子的世界。

我們(men) 可以大膽暢想一下,未來世界會(hui) 是什麽(me) 樣的呢?

或許那時,憑借光子在高速信息傳(chuan) 輸和處理方麵的優(you) 勢,光量子計算機會(hui) 像今天的智能手機一樣走進千家萬(wan) 戶。

參考文獻

[1] WANG Q, HE Y, WANG H, et al. On-chip mode division (de)multiplexer for multi-band operation [J]. Opt. Express, 2022, 30(13): 22779-22787.

[2] DONG B, AGGARWAL S, ZHOU W, et al. Higher-dimensional processing using a photonic tensor core with continuous-time data [J]. Nat. Photon., 2023, 17(12): 1080-1088.

[3] YU N, GENEVET P, KATS M A, et al. Light Propagation with Phase Discontinuities: Generalized Laws of Reflection and Refraction [J]. Science, 2011, 334(6054): 333-337.

[4] 王東(dong) ,馬少平. 圖解人工智能 [M]. 北京: 清華大學出版社, 2023.

[5] XU L, RAHMANI M, MA Y, et al. Enhanced light–matter interactions in dielectric nanostructures via machine-learning approach [J]. Advanced Photonics, 2020, 2(02): 026003.

[6] ASHTIANI F, GEERS A J, AFLATOUNI F. An on-chip photonic deep neural network for image classification [J]. Nature, 2022, 606(7914): 501-506.


轉載請注明出處。

免責聲明

① 凡本網未注明其他出處的作品,版權均屬於(yu) fun88网页下载,未經本網授權不得轉載、摘編或利用其它方式使用。獲本網授權使用作品的,應在授權範圍內(nei) 使 用,並注明"來源:fun88网页下载”。違反上述聲明者,本網將追究其相關(guan) 責任。
② 凡本網注明其他來源的作品及圖片,均轉載自其它媒體(ti) ,轉載目的在於(yu) 傳(chuan) 遞更多信息,並不代表本媒讚同其觀點和對其真實性負責,版權歸原作者所有,如有侵權請聯係我們(men) 刪除。
③ 任何單位或個(ge) 人認為(wei) 本網內(nei) 容可能涉嫌侵犯其合法權益,請及時向本網提出書(shu) 麵權利通知,並提供身份證明、權屬證明、具體(ti) 鏈接(URL)及詳細侵權情況證明。本網在收到上述法律文件後,將會(hui) 依法盡快移除相關(guan) 涉嫌侵權的內(nei) 容。

網友點評
0相關評論
精彩導讀