Startup Positron, rozwijający układy scalone do inferencji AI w centrach danych, pozyskał 230 mln USD w rundzie finansowania serii B. Rundzie przewodzili inwestorzy strategiczni, w tym Arena Private Wealth oraz Jump Trading - obie firmy z siedzibą w Chicago, działające w obszarze handlu finansowego, a jednocześnie potencjalni klienci Positronu.
Działająca od zaledwie 34 miesięcy spółka osiągnęła wycenę post-money przekraczającą 1 mld USD, dołączając tym samym do rosnącej grupy jednorożców w segmencie układów AI.
CEO Positronu, Mitesh Agrawal, powiedział, że tak duża runda finansowania była efektem ogromnego napływu zainteresowania ze strony rynku.
- Ta runda pozwala nam przejść do ofensywy - powiedział Agrawal. - Jeśli chcemy działać na taką skalę, zarówno po stronie dostaw, jak i całego ekosystemu, omijając CoWoS i HBM, musimy udowodnić, że jesteśmy w stanie dowieźć projekt i skalować produkcję. To także sygnał dla klientów, że jesteśmy partnerem długoterminowym.
Elastyczna strategia wejścia na rynek
Dodatkowy kapitał daje firmie możliwość równoległego testowania kilku strategii rynkowych.
- Większy budżet pozwala nam obsługiwać różne klasy obciążeń, docierać do różnych grup klientów i dłużej promować nasze układy scalone” - wyjaśnił Agrawal. - Gdy rynek oferuje kapitał, warto z niego skorzystać. Warunki mogą się zmienić, nawet przy świetnym produkcie - to także kwestia pragmatyzmu.
Wśród nowych inwestorów znaleźli się również Qatar Investment Authority (QIA) oraz fundusz Helena, skoncentrowany na projektach proklimatycznych.
Agrawal podkreślił, że efektywność energetyczna może mieć realny wpływ na wykorzystanie istniejących, chłodzonych powietrzem centrów danych, co zwróciło uwagę inwestorów z obszaru climate tech.
Architektura oparta na FPGA i ASIC
Positron rozwija akcelerację sprzętową inferencji transformerów w centrach danych. Pierwsza generacja produktu, Atlas, oparta jest na układach FPGA - konkretnie Intel Agilex-7M z pamięcią HBM oraz DDR5. Kluczową przewagą technologii Positronu jest bardzo wysoki poziom wykorzystania przepustowości pamięci - aż 93% w przypadku HBM.
Ponieważ inferencja transformerów jest ograniczona przepustowością pamięci, a nie mocą obliczeniową, efektywne zarządzanie pamięcią pozwala generować tokeny szybciej niż w przypadku obecnej generacji GPU, mimo niższej teoretycznej liczby FLOPS w FPGA.
Asimov - wieloukładowy ASIC nowej generacji
Druga generacja produktu, nazwana Asimov, to wieloukładowy ASIC oparty na chipletach. Zamiast HBM wykorzystuje on pamięć LPDDR, przy czym - dzięki zbliżeniu się do teoretycznej granicy przepustowości - nie wymaga stosowania HBM do osiągania wysokiej wydajności. Asimov integruje rozwinięte jednostki obliczeniowe znane z Atlasa, wzbogacone o rdzenie Arm oraz rozszerzone funkcje sieciowe. Każdy układ będzie dysponował 2 TB pamięci LPDDR5x, a cztery układy Asimov trafią do jednego serwera chłodzonego powietrzem o nazwie Titan.
Kluczowym elementem architektury jest chiplet Weaver firmy Credo Semiconductor - układ typu memory fanout gearbox, umożliwiający wysokoprzepustową komunikację pomiędzy pamięcią LPDDR a ASIC. Weaver osiąga gęstość 2 Tbit/mm przy zużyciu energii 1 pJ/bit, wykorzystując interfejsy SerDes 112G VSR oraz PHY LPDDR. Asimov będzie korzystał z 20 takich chipletów.
Dzięki architekturze chipletowej możliwa będzie aktualizacja projektu (tzw. mini-tock) wraz z pojawieniem się wersji LPDDR6, bez konieczności pełnego respinu układu.
Model „tick-tock” i rozwój zespołu
Zespół Positronu wzrósł w ciągu ostatnich sześciu miesięcy do 50 osób i ma osiągnąć około 100 pracowników do końca 2026 roku. Firma prowadzi cały proces projektowania ASIC-ów wewnętrznie, zachowując pełną kontrolę nad końcowym projektem i zestawami masek, co jest kluczowe na późnych etapach produkcji.
Positron planuje kontynuować strategię znaną z modelu tick-tock: najpierw wprowadzać wersje FPGA, a następnie odpowiadające im wersje ASIC, co pozwala szybciej wejść na rynek i zebrać informacje zwrotne od klientów. Celem jest coroczny cykl wydawniczy.
Trading finansowy jako kluczowy rynek
Główny inwestor, Jump Trading, początkowo zgłosił się do Positronu jako klient, lecz po testach technologii zdecydował się na inwestycję kapitałową.
CTO Jump Trading, Alex Davies, podkreślił, że w ich zastosowaniach kluczowymi ograniczeniami są pamięć i pobór mocy, a nie sama moc obliczeniowa. W testach Atlas zapewnił około trzykrotnie niższe opóźnienia end-to-end niż porównywalne systemy oparte na NVIDIA H100, w środowisku chłodzonym powietrzem i z przewidywalnym łańcuchem dostaw.
Firmy tradingowe, operujące zarówno w kolokacjach giełdowych, jak i we własnych centrach danych, są szczególnie wrażliwe na zużycie energii - typowe szafy on-premise obsługują 7–15 kW. Karty FPGA Atlas zużywają jedynie 150–200 W.
Ze względu na poufność algorytmów, firmy te zwykle projektują własne ASIC, ale jednocześnie odpowiadają za największy segment wzrostu rynku FPGA. Krótkie cykle odświeżania sprzętu - często poniżej roku - pozwalają im szybko amortyzować inwestycje.
Jump Trading docenił także „ekstremalną łatwość użycia” platformy Positronu - testy zdalne zajęły zaledwie jeden dzień, a wdrożenie on-premise, planowane pierwotnie na kilka miesięcy, udało się zrealizować w ciągu kilku tygodni. Pierwsze wdrożenie ma charakter pilotażowy, jednak - jak podkreśla Agrawal - rynek ten oferuje dużą stabilność relacji biznesowych przy dobrze dopasowanej architekturze.
Asimov ma trafić do etapu tape-out pod koniec trzeciego kwartału, a próbki krzemowe pojawią się w pierwszym kwartale 2027 roku.
Źródło: EE Times