AMD Ryzen Embedded V2000 w komputerach COM Express Compact – 8 rdzeni do heterogenicznych obliczeń brzegowych
| TechnikaZadania obliczeniowe wykonywane "na krawędzi", czyli na wejściu komputerowych systemów analizy i przetwarzania danych, stają się coraz bardziej złożone. Niedawno wprowadzona na rynek rodzina procesorów firmy AMD Ryzen Embedded V2000, zawierająca do 8 rdzeni i obsługująca do 16 wątków, toruje drogę dla projektów opartych na architekturze x86 z niespotykaną dotąd wydajnością obliczeniową i efektywnością energetyczną. Firma congatec oferuje już moduły COM Express Compact z tą nową generacją procesorów opartą na platformie Zen 2, która uzupełnia dotychczasowe rozwiązania V1000 o nowe wersje 6- i 8-rdzeniowe.
Znaczenie komunikacji stale rośnie, stąd przy szybko zwiększającej się liczbie aplikacji klasy IIoT obsługujące sieci systemy embedded muszą wykonywać coraz większą liczbę zadań, takich jak gromadzenie danych aplikacji, które należy transkodować, a czasem analizować lokalnie przy użyciu algorytmów sztucznej inteligencji (AI). Jednocześnie dane muszą być wymieniane z chmurami korporacyjnymi klientów i innymi aplikacjami OEM, a komunikacja ta musi być oczywiście bardzo bezpieczna, ponieważ nowe modele płatności za użycie zamieniają urządzenia, maszyny i systemy w źródło przychodów OEM, które musi być chronione. Szyfrowanie wymaga dodatkowej mocy obliczeniowej, a poza tym idealnie byłoby, gdyby systemy wbudowane były stale monitorowane za pomocą działających w tle narzędzi w celu zapobiegania atakom. Wszystko to wymaga równoległego działania wielu procesów, dlatego każdy dodatkowy rdzeń procesora w systemie wbudowanym jest dzisiaj bardzo mile widziany, ponieważ można mu wtedy przypisać określone zadania za pomocą technologii hiperwizora pracującej w czasie rzeczywistym.
Nowe procesory AMD Ryzen Embedded V2000 rozszerzają dotychczasowe możliwości zapewniane przez technologię procesorów V1000 i wyznaczają zupełnie nowe standardy, umożliwiając budowę modułowych komputerów COM Express Type 6 z 8-rdzeniowymi procesorami o 16 wątkach. Co więcej, TDP tych rozwiązań zawiera się od 54 W przy pełnej wydajności do zaledwie 10 W. Ma to kluczowe znaczenie dla funkcjonalności wielu bezwentylatorowych systemów wbudowanych, a następnie powoduje zarówno ogromny skok wydajności, jak i znacznie zwiększa możliwości pracy wielozadaniowej. Nowe procesory zapewniają użytkownikom dwukrotnie większą moc obliczeniową na wat zasilania i około 15% większą liczbę wykonywanych instrukcji na taktowanie zegara (IPC). Mają także dwukrotnie więcej rdzeni w porównaniu z poprzednią generacją.
Nowa mikroarchitektura Zen 2 w procesie 7 nm
Znaczący wzrost wydajności przetwarzania danych w porównaniu z procesorami z rodziny V1000 jest możliwy dzięki wykorzystaniu nowej architektury procesora o nazwie "Zen 2" oraz bardziej zaawansowanego procesu technologii półprzewodnikowej o wymiarze charakterystycznym 7 nm. Firma AMD zachowała wiele innowacyjnych rozwiązań z pierwszej mikroarchitektury Zen – na przykład mechanizm CPU Core Complex (CCX) łączący do 4 rdzeni w jedną jednostkę. W CCX każdy rdzeń może uzyskać dostęp do współużytkowanej pamięci podręcznej L2 i L3 z takim samym małym opóźnieniem. W porównaniu z V1000, AMD podwoiło pamięć podręczną poziomu L2 z 2 MB do 4 MB i do 8 MB na CCX dla pamięci podręcznej L3. Chociaż pamięć cache L1 nie została zwiększona, jej przepustowość została podwojona z 16 do 32 KB na cykl zegarowy. Wydajność operacji zmiennoprzecinkowych również została podwojona ze 128 do 256 bitów, co znacznie przyspiesza np. wykonywanie instrukcji AVX2.
Jednym z efektów tych usprawnień jest 15-procentowy wzrost wskaźnika IPC. W połączeniu z lepszym procesem półprzewodnikowym (przejście z 14 do 7 nm) zaowocowało to łącznie dwukrotnie wyższą wydajnością wielowątkową na wat mocy zasilania i do 30% wyższą wydajnością jednowątkową.
Testy porównawcze (benchmarki)
Firma AMD wykorzystała uznane w branży programy testujące, aby przekonać środowisko o wydajności procesorów AMD Ryzen Embedded V2000. W ich ramach procesor AMD Ryzen V2718 o TDP 15 W, 8 rdzeniach i przy bazowym taktowaniu 1,7 GHz został zestawiony z 6-rdzeniowym procesorem Intel Core i7 10710U taktowanym 1,6 GHz i z czterordzeniowym Intel Core i7 10510U taktowanym zegarem 1,8 GHz. Oba są procesorami dziesiątej generacji i mają TDP 15 W. Jak widać z rysunku 2, chociaż 6- i 4-rdzeniowe procesory Intela są równe pod kątem wydajności jednowątkowej z AMD Ryzen V2000, wyniki znacznie się zmieniają przy badaniach wydajności wielordzeniowej. Tutaj V2000 jest ponad dwukrotnie szybszy niż czterordzeniowy i7, a także ma wyraźną przewagę około 33% w stosunku do sześciordzeniowego i7. Wahadło przechyla się na korzyść procesora AMD Ryzen V2000 również pod względem wydajności graficznej. W porównaniu z obydwoma procesorami i7 osiąga on ponad dwukrotnie wyższe wyniki w teście 3DMark Time Spy. Nawet w porównaniu z układem o znacznie większym TDP, jak 6-rdzeniowy Intel Core i7 9750H z TDP 45 W taktowanym 2,6 GHz, Ryzen V2000 zapewnia wyjątkową wydajność. Oferuje prawie identyczną wydajność jednowątkową, ale o około 45% większą wydajność wielowątkową i prawie 40% większą wydajność grafiki.
O 40% większa wydajność grafiki
Oprócz mocy obliczeniowej wydajność grafiki też jest imponująca. Zintegrowana z procesorem w ramach jednostki SoC karta graficzna AMD Radeon RX Vega, jest oparta na architekturze GCN piątej generacji i obsługuje do 7 jednostek GPU. Jej wydajność wzrosła o 40% w porównaniu z i tak niezłym poprzednikiem. Karta korzysta również z bardziej energooszczędnej technologii 7 nm, a przy 1,6 GHz częstotliwość taktowania jest również większa o 300 MHz w porównaniu do poprzednika.
Obsługa 4×4K UHD
Rodzina procesorów AMD Embedded Ryzen V2000 może obsługiwać równolegle cztery niezależne wyświetlacze o rozdzielczości 4 K, zachowując przy tym częstotliwość odświeżania 60 Hz dającą płynność treści i zapewniając realistyczną reprodukcję obrazu dzięki dużemu zakresowi dynamiki (HDR) z 10-bitową głębią kolorów na kanał. Oprócz typowych aplikacji w obszarze digital signage i gier, 10-bitowe kodowanie koloru przydaje się w wysokiej jakości medycznych systemach diagnostycznych. Z kolei DirectX 12 i OpenGL w wersji 4.4 zapewniają wydajną obsługę grafiki 3D, a zintegrowany silnik wideo umożliwia przyspieszane sprzętowo przesyłanie strumieniowe treści wideo o rozdzielczości 4 K HEVC (H.265 i VP9) przy 60 Hz w obu kierunkach bez obciążania procesora. Grafika Vega wspiera najnowsze interfejsy wyświetlaczy, w tym DisplayPort 1.4, HDMI 2.1 oraz eDP 1.4, co jest gwarancją dużej przepustowości. Obsługa HSA i OpenCL 2.0 pozwala na przypisanie do GPU zadań obliczeniowych w aplikacjach uczenia maszynowego i zapewnienie dodatkowego zysku na wydajności.
Zoptymalizowane interfejsy
Nowy procesor ma więcej szybkich interfejsów komunikacyjnych i dostępnych linii I/O, aby sprostać wymaganiom wysokowydajnych systemów brzegowych i bazujących na tym chipie komputerów przemysłowych, na które jest dziś szczególnie duże zapotrzebowanie. Procesory V2000 obsługują 20 linii PCIe Gen 3. To o 8 więcej niż było w V1000, która nawet z 4 dodatkowymi liniami PCIe ma łącznie tylko 16 linii. Co więcej, procesory V2000 umożliwiają pełną implementację USB-C. Dzieje się tak, ponieważ 2 z w sumie 4 portów USB obsługujących USB 3.1 Gen 2 o szybkości 10 Gb/s obsługuje również tryby USB Power Delivery (PD) i Alt-DP z liniami DisplayPort 1.4. Ponadto nowe SoC-e obsługują 4×USB 2.0, zapewniając kompatybilność wsteczną. Jak poprzednio, do przechowywania danych są dostępne 2 porty SATA. Tym razem jednak nośniki pamięci masowej najlepiej podłączyć za pomocą szybkiego interfejsu NVMe, który zapewnia znacznie większą przepustowość.
Układy SoC AMD Ryzen V2000 dodatkowo obsługują szereg interfejsów specjalnie dostosowanych do rynku sprzętu embedded, takich jak starsze UART-y, I²C, SMBus, SPI i GPIO.
Większa ochrona
Oprócz lepszej wydajności nowe procesory V2000 zapewniają również zaawansowane funkcje bezpieczeństwa, które zapewniają lepszą ochronę przed nieautoryzowanym dostępem do przechowywanych danych lub kodu oprogramowania. Podobnie jak jest w układach z rodziny V1000 i R1000, tutaj też mechanizm AMD Memory Guard realizuje kilka istotnych funkcji bezpieczeństwa, między innymi:
- bezpieczne szyfrowanie pamięci głównej, które blokuje atakującemu dostęp do poufnych danych i pomaga chronić się przed atakami w czasie restartu,
- bezpieczny rozruch chroni proces uruchamiania komputera, aby żadne nieautoryzowane oprogramowanie nie mogło przejąć ważnych funkcji systemu,
- UEfiSecure Boot zapobiega ładowaniu złośliwego kodu lub nieautoryzowanego oprogramowania podczas uruchamiania systemu.
Aby zapewnić, że proces szyfrowania i dekodowania zaszyfrowanych danych nie wpłynie negatywnie na wydajność systemu, procesory V2000 mają wbudowany akcelerator AES-NI. Architektura Zen 2 zapewnia również sprzętową ochronę przed dobrze znanymi exploitami Spectre i Spectre v4. W rezultacie producenci OEM i użytkownicy nie muszą już polegać na mechanizmach zabezpieczeń zapewnianych przez systemy operacyjne.
Moduły COM Express Compact
Nowa seria procesorów V2000 jest dostępna w czterech wariantach. Wszystkie te typy są wytwarzane w modułach conga-TCV2 COM Express Type 6 Compact firmy congatec. Wyposażone są w 4 MB pamięci podręcznej L2, 8 MB pamięci podręcznej L3 i do 64 GB dla szybkiej i energooszczędnej 64-bitowej dwukanałowej pamięci DDR4 z prędkością do 3200 MT/s i obsługą ECC zapewniającą maksymalną integralność danych. Komputery conga-TCV2 obsługują do czterech niezależnych wyświetlaczy o rozdzielczości do 4 K@ 60 fps przez 3 interfejsy: DisplayPort 1.4 / HDMI 2.1 i LVDS/eDP. Do dyspozycji jest też 1× PEG 3.0 ×8 i 8× PCIe Gen 3, 2× USB 3.1 Gen 2, 8× USB 2.0, 2× SATA Gen 3, Gbit Ethernet, 8 GPIO, SPI, LPC i 2× UART.
Komputer obsługuje hiperwizor RTS i pozwala na pracę w systemach operacyjnych takich jak Microsoft Windows 10, Linux/Yocto, Android Q i Wind River VxWorks. Aplikacje o wysokich wymaganiach w zakresie bezpieczeństwa korzystają ze zintegrowanego procesora AMD Secure, który realizuje szyfrowanie sprzętowe i algorytmami RSA, SHA i AES. Na płytce jest też moduł TPM.
Idealny wybór do wszystkich typów urządzeń krawędziowych
Duża wydajność i funkcjonalność modułów COM Express Type 6 pozwala na użycie ich do digitalizacji i równoległej analizy brzegowej sygnałów z aplikacji IoT, w tym do równoważenia obciążenia i konsolidacji, które umożliwiają maszyny wirtualne oparte na implementacje hiperwizora RTS firmy congatec w czasie rzeczywistym. W porównaniu do starszych rozwiązań, komputery te mogą wykonywać dwa razy więcej zadań w danym zakresie TDP od 10 do 54 W. Nie oznacza to jednak, że seria V1000 automatycznie stała się przestarzała – w przypadku, gdy wystarcza mniejsza wydajność, V1000 jest nadal najlepszym wyborem.
Nowe moduły świetnie nadają się również do inteligentnej robotyki, e-mobilności i pojazdów autonomicznych, które wykorzystują algorytmy uczenia maszynowego do optymalizacji działania.
Więcej informacji na temat nowego komputera conga-TCV2 COM Express Type 6 Compact można znaleźć pod adresem: https://www.congatec.com/en/products/com-express-type-6/conga-tcv2/
Zeljko Loncaric, congatec
www.congatec.com