Obliczenia tensorowe z prędkością światła jako fundament nowej generacji fotonicznych systemów AI
Naukowcy z Uniwersytetu Aalto zaprezentowali obliczenia tensorowe typu single-shot wykonywane z prędkością światła - przełomowy krok w stronę sprzętu nowej generacji dla sztucznej inteligencji ogólnej (AGI), opartego nie na elektronice, lecz na obliczeniach optycznych. Tensorowe operacje matematyczne stanowią fundament współczesnych technologii, a szczególnie systemów sztucznej inteligencji. Wychodzą jednak daleko poza proste działania arytmetyczne. Można je porównać do wielowymiarowego obracania, przekształcania czy „cięcia” kostki Rubika. Podczas gdy człowiek i klasyczne komputery muszą wykonywać te operacje krok po kroku, światło może zrealizować je wszystkie jednocześnie.
Współcześnie każda aplikacja AI - od rozpoznawania obrazów po przetwarzanie języka naturalnego - wykorzystuje operacje tensorowe. Jednocześnie gwałtowny wzrost ilości danych sprawia, że tradycyjne platformy cyfrowe, takie jak procesory GPU, osiągają granice możliwości w zakresie szybkości, skalowalności i zużycia energii.
Światło jako narzędzie natychmiastowych obliczeń tensorowych
W odpowiedzi na to wyzwanie międzynarodowy zespół badawczy kierowany przez dr. Yufenga Zhanga z Photonics Group na Wydziale Elektroniki i Inżynierii Nano Uniwersytetu Aalto opracował nowe podejście, w którym złożone obliczenia tensorowe są wykonywane podczas pojedynczej propagacji światła. Efektem jest single-shot tensor computing, czyli obliczenia tensorowe realizowane z prędkością światła.
Wyniki badań opublikowano w czasopiśmie Nature Photonics.
- Nasza metoda wykonuje te same operacje, którymi dziś zajmują się procesory GPU lecz realizuje je z prędkością światła - wyjaśnia dr Zhang. - Zamiast polegać na obwodach elektronicznych, wykorzystujemy fizyczne właściwości światła, dzięki czemu wiele obliczeń zachodzi równolegle.
Aby to osiągnąć, badacze zakodowali dane cyfrowe w amplitudzie i fazie fal świetlnych, zamieniając liczby na parametry fizyczne pola optycznego. Gdy pola te łączą się i oddziałują, naturalnie wykonują działania matematyczne, takie jak mnożenie macierzy i tensorów - będące podstawą algorytmów głębokiego uczenia. Wprowadzając dodatkowo wiele długości fal, zespół rozszerzył tę metodę na obliczenia tensorowe wyższych rzędów.
Potencjalny wpływ i zastosowania
- Wyobraź sobie, że jesteś celnikiem i musisz sprawdzić każdy pakunek, przepuszczając go kolejno przez różne urządzenia, a następnie posegregować. W klasycznym podejściu robisz to po kolei - tłumaczy Zhang. - W naszym systemie optycznym wszystkie pakunki i wszystkie maszyny fizycznie łączą się w jeden proces - tworzymy wiele ‘optycznych haków’, które dopasowują każde wejście do odpowiedniego wyjścia. Jedno przejście światła wystarcza, by wszystko przetworzyć równocześnie.
Istotną zaletą tej technologii jest jej prostota. Operacje optyczne zachodzą pasywnie podczas propagacji światła, dzięki czemu nie wymagają aktywnego sterowania ani elektronicznego przełączania w trakcie obliczeń.
- To podejście można wdrożyć na niemal dowolnej platformie optycznej - mówi prof. Zhipei Sun, lider Photonics Group w Aalto University. - W przyszłości planujemy integrację tej architektury bezpośrednio z fotonicznymi układami scalonymi, umożliwiając rozwój procesorów światłowodowych realizujących złożone zadania AI przy ekstremalnie niskim poborze mocy.
Ostatecznym celem jest uruchomienie tej technologii na istniejących platformach sprzętowych największych firm technologicznych. Dr Zhang ostrożnie szacuje, że zajmie to od trzech do pięciu lat.
- Otwiera to drogę do nowej generacji systemów optycznych, które znacząco przyspieszą złożone zadania AI w ogromnej liczbie zastosowań - podsumowuje.
Źródło: Techxplore