Moduły OptiMOS w platformie Corsair
Infineon Technologies AG poinformował o współpracy z d-Matrix, firmą rozwijającą rozwiązania obliczeniowe do interaktywnej inferencji AI o niskich opóźnieniach. Rozwiązania zasilania Infineon zostały zastosowane w akceleratorze Corsair, gdzie mają wspierać wydajność, efektywność energetyczną oraz integrację systemową na płytach o dużej gęstości upakowania.
Platforma d-Matrix wykorzystuje dwufazowe moduły zasilania Infineon OptiMOS TDM2254xx. Według producenta umożliwiają one rzeczywiste pionowe dostarczanie energii i oferują gęstość prądową na poziomie 1,0 A/mm². W przypadku akceleratorów inferencyjnych stosowanych w centrach danych architektura zasilania ma istotne znaczenie dla opóźnień, sprawności energetycznej i ogólnej wydajności systemu.
Inferencja AI z naciskiem na niskie opóźnienia
d-Matrix pozycjonuje Corsair jako rozwiązanie przeznaczone do interaktywnych obciążeń AI, w których kluczowe znaczenie ma czas odpowiedzi. Sid Sheth, założyciel i CEO d-Matrix, zwrócił uwagę, że sztuczna inteligencja przechodzi od eksperymentów zapleczowych do zastosowań działających w czasie rzeczywistym, co wymaga innej architektury obliczeniowej.
Według d-Matrix akcelerator Corsair został zaprojektowany z myślą o uzyskaniu opóźnienia tokenu poniżej 2 ms, wymaganego przez aplikacje interaktywne, przy wielokrotnie lepszej efektywności energetycznej niż w tradycyjnych podejściach. Firma podkreśla, że Infineon był partnerem projektowym platformy od początku jej rozwoju, a półprzewodniki mocy dostarczane przez niemieckiego producenta stanowią istotny element osiągania zakładanych parametrów.
Zastosowania w LLM i analityce predykcyjnej
Dzięki wykorzystaniu półprzewodników mocy Infineon d-Matrix zoptymalizował swoje platformy inferencyjne pod kątem zasilania i wydajności. Jako typowe zastosowania wskazano generowanie odpowiedzi z użyciem dużych modeli językowych, aplikacje typu agentic AI oraz analitykę predykcyjną w finansach i ochronie zdrowia.
Raj Khattoi, wiceprezes i dyrektor generalny działu Consumer, Computing and Communication w Infineon, podkreślił, że firma współpracowała z klientami rozwijającymi procesory inferencyjne już na wczesnym etapie rozwoju tego segmentu, kiedy uwaga rynku koncentrowała się głównie na sprzęcie do trenowania modeli AI. Według Infineona takie projekty wzmacniają pozycję firmy w obszarze zasilania układów przeznaczonych zarówno do inferencji, jak i treningu.
Zasilanie jako element infrastruktury AI
Wraz ze wzrostem skali obciążeń AI rośnie zapotrzebowanie na wydajne i niezawodne rozwiązania zasilania dla centrów danych. Współpraca Infineona z d-Matrix wpisuje się w ten trend, łącząc akcelerator inferencyjny o niskich opóźnieniach z modułami mocy przeznaczonymi do pracy w systemach obliczeniowych o wysokiej gęstości.
Źródło: Infineon