COM-HPC - nowy standard w systemach embedded
| TechnikaCOM-HPC to nadchodzący nowy standard PICMG definiujący klasę wysokowydajnych modułów CoM (Computer-on-Modules). Oficjalnie COM-HPC zostanie zatwierdzony przez PICMG w pierwszej połowie 2020 roku, jest więc jeszcze trochę czasu i drobne szczegóły mogą się zmienić. Niemniej dwa kluczowe aspekty zostały już zatwierdzone w listopadzie 2019 r.: fizyczne wymiary i rozkład wyprowadzeń (pinout). Dzięki temu firmy zaangażowane w tworzenie specyfikacji mogą zaprezentować swoje pierwsze produkty na rynku zaraz po oficjalnej premierze.
COM-HPC wydaje się na tyle obiecujący, że projektanci wydajnych systemów embedded wiążą z nim duże nadzieje na wykorzystanie w sprzęcie wysokiej klasy razem z nowymi procesorami Intela i AMD. IHS Markit szacuje, że w 2020 roku komputery w formie modułów CoM będą tworzyć około 38% całkowitej sprzedaży systemów i jednostek obliczeniowych do zastosowań w systemach embedded. To wyjaśnia istotę i znaczenie nadciągających zmian na rynku, gdzie od momentu pojawienia się pierwszego komputera CoM powstały jedynie dwa ważne standardy kierowane do zaawansowanych systemów: wcześniejszy ETX i jego następca COM Express.
Większa wydajność, więcej interfejsów
Potrzebę powstania nowej specyfikacji uzupełniającej istniejący COM Express można łatwo wyjaśnić. W wyniku transformacji cyfrowej rośnie zapotrzebowanie na wydajne komputery. Są one niezbędne do budowy nowych serwerów brzegowych zapewniających możliwość skalowania wydajności. Ponadto rozwiązania bazujące na COM Express na skutek ograniczonej liczby wyprowadzeń do 440 nie zapewniają już wystarczającej liczby interfejsów niezbędnych dla wydajnych komputerów, a przepustowość złącza COM Express również powoli zbliża się do granic wyznaczanych przez częstotliwość taktowania magistrali 8 GHz. Dla PCIe Gen 3 ogranicza ona wydajność do 8 Gb/s.
Wydajność serwerów embedded
Potrzeba ultrawysokiej wydajności komputerów w aplikacjach embedded i rozbudowanej komunikacji jest największa w nowej klasie serwerów headless (bez interfejsu graficznego), które są coraz częściej używane są jako systemy rozproszone w aplikacjach przemysłowych w trudnych środowiskach i w rozszerzonym zakresie temperatur. Aby zilustrować tę potrzebę wysokiej wydajności, weźmy na przykład pojazd autonomiczny, który wykorzystuje system wizyjny i algorytmy AI do ustalenia tzw. świadomości sytuacyjnej. W takim zastosowaniu nie ma możliwości czekania, aż dane zostaną przeliczone w chmurze obliczeniowej, bo reakcja systemu musi być natychmiastowa. To samo dotyczy robotów współpracujących. Wymaga to, aby jednostki komputerowe zapewniały łączność co najmniej 10 GbE, a także możliwość łączenia ich w bloki składające się z dużej liczby równoległych jednostek – na przykład do wstępnego przetwarzania danych z czujników obrazów lub wykonywania złożonych algorytmów głębokiego uczenia.
Warto zauważyć, że obecnie coraz częściej do wykonywania takich złożonych zadań wykorzystywane są jednostki GPGPU. Często zastępują one koprocesory na układach FPGA i DSP i potrzebują szybkiej łączności z rdzeniami procesora. Potrzeba ta wzrasta wraz ze złożonością realizowanych zadań. Dzięki wielu liniom komunikacyjnym interfejsu PCIe systemy COM- -HPC mogą pomieścić znacznie więcej kart akceleracyjnych z GPU, co zapewnia dalszy wzrost wydajności niż kiedykolwiek było to możliwe w COM Express.
Równoległe przetwarzanie danych
Jednostki komputerowe zawierające wydajne procesory i równoległe przetwarzanie danych są również wymagane w obrazowaniu medycznym. W tej dziedzinie szybko wzrasta wykorzystanie sztucznej inteligencji do wspierania diagnozy medycznej. Takie same wymagania w zakresie wydajności mają niezliczone systemy wizyjne stosowane w przemysłowych systemach sterowania i kontroli oraz te używane w publicznych systemach monitoringu wideo.
Co więcej, cały obszar aplikacji Przemysłu 4.0 wymaga również wydajniejszej łączności, ponieważ coraz więcej niezależnych maszyn i systemów jest podłączanych do sieci. Wszystko to powoduje wzrost zapotrzebowania na szybkie interfejsy w systemach wbudowanych do wdrażania wysokowydajnych rozwiązań internetowych, w tym do zapewnienia TSN (Time- Sensitive Networking), a więc reakcji w czasie rzeczywistym. Ponadto coraz więcej zadań obliczeniowych wymaga konsolidacji w jednym systemie. Oprócz wstępnego przetwarzania danych w systemach wizyjnych i głębokiego uczenia, obejmuje to zapory (firewalle) i systemy detekcji włamań, które muszą przetwarzać praktycznie identyczne dane, działając równolegle do uruchomionych aplikacji. Podwaja to wymagania na wydajność i wymaga stosowania technologii hypervisor w przypadku maszyn wirtualnych obsługujących w czasie rzeczywistym, takich jak RTS Hypervisor firmy Real-Time Systems. Inne zastosowania obejmują urządzenia do przechwytywania danych dla samochodowych systemów testowych i aparatury pomiarowej dla 5G, a także przemysłowe systemy pamięci masowej bazujące na nośnikach NVMe podłączanych przez PCIe. Systemy logiki w stacjach przekaźnikowych sieci 5G i modułowe serwery kasetowe instalowane w przemysłowych szafach serwerowych mogą również skorzystać z wydajnych rozwiązań CoM.
Do 1 TB pamięci RAM
COM HPC zapewni spełnienie wymagań dotyczących wysokiej prędkości komunikacji do 100 GbE, w tym do 32 Gb/s dla PCIe Gen 4 i Gen 5. Będzie zapewniał obsługę do 8 gniazd DIMM i wspierał użycie szybkich procesorów TDP ponad 200 W. Będą dostępne dwa podstawowe warianty: moduły serwerowe COM HPC typu headless, które można również nazwać modułami serwerowymi (Server-on-Modules) oraz moduły klienta COM HPC, które są zgodne z koncepcją CoM w wykonaniu COM Express typu 6.
Modułowy serwer SoM COM HPC będzie w stanie obsłużyć nawet 1 TB RAM dzięki 8 gniazdom DIMM. Będzie również działać z prędkością do 8×25 GbE i obsługiwać do 64 linii PCIe Gen 4 lub Gen 5 – tj. wydajność linii I/O sięgnie 256 GB/s. Tak ultraszybka komunikacja mieści się w klasie serwerów brzegowych embedded, a nowe linie w interfejsie PCIe zapewnią ponad 32 Gbit/s w ramach PCIe Gen 5. Taka wydajność jest rzeczywiście potrzebna w wymienionych aplikacjach i może być osiągana z użyciem interfejsów o wysokiej przepustowości, ponieważ na rynku są już chipy zapewniające transfer 28 Gbs z kodowaniem Non-Return-to-Zero (NRZ).
Ponadto 800 pinów w gnieździe umożliwia dodanie jeszcze maksymalnie dwóch niezwykle wydajnych interfejsów USB 4. Będą one oparte na Th underbolt 3.0 i zapewnią transfer 40 Gb/s (odpowiada to około 5 GB/s), czyli około dwa razy szybciej niż jest to w USB 3.2, gdzie maksymalna prędkość sięga 20 Gb/s. Poza nimi do kompletu USB w COM HPC dochodzą jeszcze 4 "zwykłe" interfejsy USB 2.0. Wspomnieć można też o standardowych interfejsach komunikacyjnych wyprowadzonych na złącze, w tym natywnym SATA 2×, obsłudze eSPI, 2×SPI, SMB, 2×I2C, 2×UART, a nawet 12 liniach GPIO, np. do celów serwisowych.
Zarządzanie płytami serwerowymi
Kolejną nową funkcją w COM-HPC jest zintegrowany interfejs zarządzania systemem. Jest on obecnie definiowany przez podkomitet PICMG i ma na celu włączenie niewielkiej części potężnej i złożonej definicji IPMI (Intelligent Platform Management Interface) do specyfikacji COM-HPC, aby umożliwić łatwą implementację pełnej funkcjonalności serwera. Dzięki temu interfejsowi COM-HPC będzie oferował funkcje serwera edge, które dodatkowo można będzie rozszerzyć poprzez zintegrowanie odpowiednich kontrolerów zarządzania tablicą klasy serwerowej (BMC, Board Management Controller) na płytkach rozszerzeń.
W celu łatwej implementacji standardu przygotowane zostaną też noty aplikacyjne w zakresie płytek bazowych (carrier boards). Specyfikacja zapewni ponadto możliwość opracowania zgodnych z COM-HPC modułów urządzeń współpracujących, w tym procesorów graficznych lub jednostek z układami FPGA. W tym celu udostępniono sygnał zegara taktującego PCIe, dzięki czemu moduły COM-HPC mogą być również używane jako aplikacje klienckie. Umożliwia to projektowanie elastycznych i kompaktowych heterogenicznych rozwiązań obliczeniowych bez potrzeby stosowania skomplikowanych kart podwyższających. Tradycyjnie karty graficzne są opracowywane dla gniazd PCIe montowanych pod kątem 90º na płycie głównej, co może być kłopotem. Oferują również znacznie mniej opcji komunikacji. To samo dotyczy alternatywnych kart graficznych MXM3, ponieważ mają one tylko 314 pinów. Dzięki COM-HPC umożliwiającemu realizację bardzo cienkich konstrukcji modułowych, także dla GPGPU, staje się możliwe projektowanie smukłych kart do slotów dla systemów szaf, które oferują zarówno moduły serwerowe COM-HPC, jak i moduły akceleracyjne oparte na GPGPU, FPGA lub DSP. Rozwiązania pasujące do wszystkich trzech wariantów modułów akceleracyjnych są już opracowywane, dzięki czemu COM-HPC nie jest już tylko standardem dla procesorów w serwerach brzegowych, ale może być również wykorzystywany do rozbudowy zasobów GPGPU, FPGA i DSP.
Płyty bazowe klasy serwerowejProjektanci, którzy chcą już teraz rozpocząć tworzenie płyt bazowych COM-HPC o wydajności serwerowej, powinni zapoznać się z płytką mini-STX conga-STX7. Ma ona wymiary 5,5×5,8 cala i opracowana została wprawdzie dla modułów Server-on-Modules COM Express Type 7, ale zawiera zintegrowany kontroler BMC (Board Management Controller). Zapewnia on wydajne funkcje zdalnego monitorowania, zarządzania i serwisu. Za tę funkcję odpowiada układ AST2500 BMC firmy Aspeed, oparty na procesorze ARM11 800 MHz, obsługuje DDR4 1600 Mb/s i ma wbudowaną kartę PCIe 2D VGA do realizacji konsoli zarządzania. Congatec zoptymalizował oprogramowanie kontrolera, aby spełnić wymagania zarządzania serwerami brzegowymi i mikroserwerami modułowymi. Obejmuje to możliwość użycia istniejących wbudowanych interfejsów API standardów PICMG do wdrożenia wszystkich niezbędnych dzienników zdarzeń i alertów w systemie zdalnego zarządzania za pośrednictwem tej implementacji czujnika. Ponadto zaimplementowano polecenia IPMI do sterowania zasilaniem, KVM i funkcje przekierowywania mediów, aby obsługiwać zarówno lokalnie podłączone konsole serwerowe, jak i zdalny KVM. Konsola debugowania hosta z przełączaniem danych wyjściowych między różnymi obiektami docelowymi systemu hosta jest też w tej wersji. |
800 wyprowadzeń zamiast 440
Poza klasą wydajnych serwerów brzegowych embedded, która ustanawia zupełnie nowy standard w zakresie technik komputerowych, druga kategoria modułów klienckich w ramach COM-HPC lokuje się w zakresie możliwości nieco wyżej niż specyfikacja COM Express Type 6. Ponieważ mniejszy rozmiar płytki pozwala pomieścić tutaj tylko do czterech gniazd SODIMM, kluczową różnicą jest przede wszystkim liczba pinów: 800 linii to znacznie więcej funkcjonalności w zakresie interfejsów niż dla 440 pinów w COM Express. Ale dopóki COM Express obsługuje również PCIe Gen 4 – co można założyć przynajmniej w odniesieniu do kompatybilności w dół – twórcy systemów COM Express nie muszą przerzucać się na moduły klienckie COM-HPC.
Oprócz 49 linii PCIe (COM Express Type 6 oferuje ich tylko 24), teraz są także dwa interfejsy KR o przepustowości 25 GbE i maksymalnie dwa interfejsy BaseT 10 Gb, czyli znacznie więcej niż w obecnym pojedynczym LAN GbE. Kolejną atrakcyjną funkcjonalnością są maksymalnie dwa interfejsy MIPICSI, które umożliwiają podłączenie tanich kamer używanych w robotach. Wielu programistów doceni również wygodne, wszechstronne i niezwykle wydajne interfejsy USB 4.0, które uzupełniają zestaw 4×USB 2.0. Będzie ich maksymalnie cztery, co pozwoli na podłączenie do komputera ultraszybkiej pamięci o prędkości do 40 Gb/s lub maksymalnie dwóch wyświetlaczy 4 K i stworzenie zintegrowanego połączenia sieciowego 10GbE za pomocą jednego kabla USB-C.
Uporządkowano także grafikę. Wsparcie obejmuje teraz 3 interfejsy DDI, a konwertery DisplayPort, DVI-I/VGA i DVI-I, HDMI lub DVI na LVDS są teraz zawarte na płycie bazowej. Dalsze interfejsy obejmują 2× SoundWire i I²S, a także 2×SATA, eSPI, 2×SPI, SMB, 2×I²C, 2×UART i 12 linii GPIO.
Łącze SoundWire, które zostało dodane jako nowy interfejs do specyfikacji, zastąpi obecnie używany interfejs HDA. Jest to standard MIPI, który wymaga tylko dwóch linii zegara do 2,288 MHz oraz linii danych i pozwala połączyć równolegle do czterech kodeków audio. Każdy kodek otrzymuje własny identyfikator.
Zainteresowani producenci OEM mogą już rozpocząć projektowanie płyt bazowych po podpisaniu zobowiązania o dochowaniu tajemnicy NDA. Po oficjalnym wydaniu nowa specyfikacja stanie się dostępna jako standard otwarty i to ograniczenie zniknie. Członkowie PICMG COM-HPC to Acromag, Adlink, Advantech, AMI, Amphenol, congatec, Elma Electronic, Emerson Machine Automation Solutions, Ept, Fastwel, GE Automation, HEITEC, Intel, Kontron, MEN, MSC Technologies, NAT, nVent, Samtec, Seco, TE Connectivity, Trenz Electronic, University Bielefeld, VersaLogic Corp.
congatec AG
info@congatec.com, www.congatec.com