Inteligentne głośniki - obecnie i w przyszłości

| Gospodarka Aktualności

Głośniki z inteligentnymi wirtualnymi asystentami (smart speakers) pojawiły się w sprzedaży już kilka lat temu - w 2015 roku w Stanach Zjednoczonych można było kupić Amazon Echo, jedno z pierwszych tego typu urządzeń. Wkrótce na rynku pojawiły się kolejne, m.in. Google Home oraz Apple HomePod. Początkowo głośniki smart traktowane były jako ciekawostka, jednak w 2017 zdecydowanie zasłużyły na miano gadżetu roku. W związku z tym warto bliżej przyjrzeć się tym urządzeniom. W artykule wyjaśniamy, czym są, na czym polega ich fenomen oraz w jakim kierunku mogą się rozwijać w przyszłości.

Inteligentne głośniki - obecnie i w przyszłości

Do zilustrowania artykułu wykorzystaliśmy zdjęcia różnych modeli głośników smart. Z pewnością według niektórych prezentują się niepozornie, inni natomiast docenią ich futurystyczny wygląd. Generalnie jednak nie da się ukryć, że ich projektanci postawili na prostotę. Co ciekawe, z tym ascetycznym wyglądem silnie kontrastuje to, co jest w środku tych urządzeń. W inteligentnych głośnikach wykorzystywane są bowiem najnowsze zdobycze techniki i to w dziedzinie, o której do niedawna wypowiadano się przede wszystkim w kontekście filmów oraz literatury z gatunku science fiction. Chodzi o sztuczną inteligencję, która jak się właśnie okazuje, pierwsze praktyczne zastosowania znajduje nie tylko w specjalistycznych aplikacjach, lecz wraz z głośnikami Amazon Echo czy Google Home trafia... pod strzechy.

NLP podstawą działania głośników smart

Głośniki smart rozumieją, co się do nich mówi i wykonują polecenia swoich właścicieli, dzięki systemom ASR (Automatic Speech Recognition) wykorzystującym techniki NLP (Natural Language Processing), czyli przetwarzania języka naturalnego. Dokonują one konwersji pomiędzy językiem, którym posługują się ludzie, a tym rozumianym przez komputer. W inteligentnych głośnikach działa to w obydwie strony.

Najpierw trzeba bowiem rozpoznać i zinterpretować komendę wydaną przez człowieka, a potem odpowiedź pobraną z bazy danych przekształcić do postaci, w której będzie dla ludzi logicznie i gramatycznie zrozumiała. Techniki przetwarzania języka naturalnego przez lata udoskonalano, jednak bardzo długo osiągane rezultaty nie były zadowalające. Przełom nastąpił stosunkowo niedawno wraz z rozwojem jednej z gałęzi sztucznej inteligencji, a mianowicie metod tzw. głębokiego uczenia się (deep learning), w którym wykorzystuje się sieci neuronowe oraz mechanizmy, które są podobne do tych, na których opiera się praca ludzkiego mózgu.

Czym jest głębokie uczenie?

W uproszczeniu głębokie uczenie polega na tym, że sieci neuronowe na podstawie danych przykładowych uczą się właściwego reagowania na konkretne ich zestawy. Podobieństwo do ludzkiego organu zapewnia wielopoziomowa struktura sieci neuronowych. Postęp w dziedzinie głębokiego uczenia był możliwy dzięki temu, że przybywa danych potrzebnych do wytrenowania sieci neuronowych i rośnie moc obliczeniowa komputerów. Obecnie jest on na takim poziomie, że w testach systemy rozpoznawania obrazów albo mowy oparte na głębokim uczeniu uzyskują lepsze wyniki niż ludzie!

Ważnym aspektem prawidłowego działania inteligentnych głośników jest dostarczenie systemom ASR dźwięków o odpowiedniej jakości. Trzeba zatem odfiltrować szumy z otoczenia i wzmocnić sygnał użyteczny. W tym celu korzysta się z rozmaitych technik, na przykład AEC (Acoustic Echo Cancellation), tzn. adaptacyjnego usuwania echa akustycznego. Oprócz tego używanych jest kilka mikrofonów (typowo cztery). Na podstawie różnic sygnałów przez nie rejestrowanych wykrywa się na przykład to, z jakiego kierunku dochodzi głos użytkownika, czy mówiący właśnie się przemieszcza i rozróżnia się głosy należące do kilku osób.

Smart głośniki podbijają rynki w USA i w Chinach

Według raportu Smart Audio Fall/Winter 2017 amerykańskiej organizacji National Public Media (NPR) i Edison Research już nawet 16% dorosłych Amerykanów, czyli około 39 milionów ludzi, ma w swoim domu inteligentny głośnik. W porównaniu ze styczniem 2017 roku oznacza to wzrost o 128%. Jedną z jego przyczyn może być to, że urządzenia te okazały się popularnym świątecznym prezentem - na Boże Narodzenie w zeszłym roku 7% Amerykanów otrzymało taki podarunek. Dla 4% z nich był to pierwszy inteligentny głośnik, jaki znalazł się w ich posiadaniu.

Dzięki temu umacnia się pozycja rynku amerykańskiego na globalnym rynku głośników smart. Według Canalys Research w 2018 roku USA zajmą pierwsze miejsce z łączną liczbą sprzedanych sztuk tych urządzeń przekraczającą 38 mln. Drugim co do wielkości rynkiem zbytu będą Chiny. W tym roku sprzedanych zostanie tam ponad 4 mln sztuk inteligentnych głośników. Co ciekawe, w 2021 roku rynek chiński ma przerosnąć ten w Stanach Zjednoczonych. Jeżeli z kolei chodzi o wartość globalnego rynku tych gadżetów, to według Markets and Markets w 2018 roku przekroczy ona 2,6 mld dolarów, zaś w 2023 roku sięgnie prawie 11,8 mld dolarów, co będzie oznaczać średni coroczny wzrost w rekordowo dużym tempie, bo aż o ponad 34% (rys. 1).

Czy inteligentne głośniki zastąpią telewizję?

Jak widać, te niepozorne urządzenia szybko zdobywają kolejne rynki i coraz więcej użytkowników. Nic zatem dziwnego, że jak wynika z badania NPR i Edison Research, mają coraz większy wpływ na zachowanie swoich właścicieli, a nawet powodują wyrabianie w nich nowych nawyków.

Na przykład prawie 40% pytanych przyznało, że na korzystanie z głośników smart przeznacza czas, który dotychczas poświęcało na słuchanie radia. Dla 34% jest to natomiast atrakcyjniejsza forma spędzania czasu niż używanie smartfona. W przypadku 30% z inteligentnymi głośnikami przegrywa telewizja, 27% - tablet, 26% - komputer, a 23% - publikacje drukowane.

Co więcej okazuje się, że urządzenia te się nie nudzą. Ponad 50% ankietowanych przyznało, że po pierwszym miesiącu ich użytkowania korzysta z nich jeszcze częściej, zaś 33% poświęca im tyle samo czasu.

Ponad 70% osób przyznało, że odkąd stali się posiadaczami głośników smart odbierają więcej treści audio. Na przykład 23% w tej formie słucha więcej wiadomości, natomiast 28% - podcastów. Sposób wykorzystania tych urządzeń zmienia się również w zależności od pory dnia.

W godzinach porannych zwykle służą do sprawdzania informacji o aktualnej sytuacji na drogach, pogodzie i najświeższych wiadomości. Służą ponadto jako budzik. Przed godziną 15 uzupełniane są listy zakupów i listy zadań do wykonania. Po południu głośniki smart są pomocne w wyszukiwaniu restauracji oraz przepisów kulinarnych i zamawianiu jedzenia z dowozem do domu.

Sterowanie głosem jest ważnym zastosowaniem

Wieczorem wiele osób używa ich do odtwarzania audiobooków oraz za ich pośrednictwem steruje pozostałymi inteligentnymi urządzeniami w domu. Spośród wszystkich możliwości, jakie oferują tytułowe urządzenia, szczególne znaczenie dla ich użytkowników ma właśnie to ostatnie. 38% z nich właśnie po to, aby móc głosowo sterować innym wyposażeniem smart w domu, zamierza dokupić kolejny inteligentny głośnik.

Jak wynika z tego opisu, są to wszechstronne urządzenia. Można dla nich znaleźć zastosowanie o każdej porze dnia jak i nocy.

Nic zatem dziwnego, że użytkownicy chcą je mieć przy sobie również poza domem. 64% pytanych chętnie zamontowałoby inteligentny głośnik w swoim samochodzie, 60% - w telefonie, 53% - w telewizorze, a 35% - w miejscu pracy. Okazuje się też, że inteligentne głośniki mają pozytywny wpływ na więzi rodzinne - ponad 50% ich użytkowników przeważnie korzysta z nich razem z pozostałymi domownikami.

Dla 66% ankietowanych urządzenia te służą do zabawiania przyjaciół i rodziny. Czas upływający im na korzystaniu z tych urządzeń spędzają zwykle na: słuchaniu muzyki (60%) i zadawaniu im pytań (30%). Ponadto w trakcie spotkań z najbliższymi m.in. sprawdzają prognozę pogody (28%), słuchają dowcipów albo radia, słuchają wiadomości ze świata i sterują pozostałymi inteligentnymi urządzeniami w domu.

Nic zatem dziwnego, że ponad 50% użytkowników umieszcza głośnik smart na honorowym miejscu w najważniejszym pomieszczeniu w domu, czyli w salonie. Często są również podłączane w kuchni (21%) albo sypialni (19%).

Rys. 1. Rynek inteligentnych głośników będzie rósł w rekordowym tempie Rys. 2. Amazon i Google zmonopolizowały rynek głośników smart (źródło: Statista

Amazon i Google na prowadzeniu

Jak wynika z rysunku 2, na rynku inteligentnych głośników działa niewielu producentów, a w zasadzie liczą się tylko dwie firmy - Amazon i Google, z udziałami odpowiednio prawie 52% oraz 36%. Z roku na rok sytuacja ta będzie się jednak na pewno zmieniać, a modeli od różnych producentów będzie przybywać. Tendencję tę można zauważyć na rysunku 2, z którego wynika, że co roku udział przedsiębiorstw zaliczanych do kategorii inne rósł.

Wśród producentów do niej należących wymienia się m.in. firmy Apple, Lenovo, Microsoft oraz chińskie: Alibaba, Baidu i JD.com. Ostatnia z nich jako pierwsza wprowadziła inteligentny głośnik na rynek chiński, natomiast Baidu zaproponowało model urządzenia całkowicie odbiegający od standardu, uzupełniając jego wyposażenie o ekran i kamerę. Na wyświetlaczu prezentowane są obrazy, które dopełniają odpowiedź głosową na pytania użytkownika, a kamera w połączeniu z oprogramowaniem do rozpoznawania twarzy jest wykorzystywana do zatwierdzania transakcji zawieranych online.

Podobieństwa i różnice

Choć niektórzy producenci zaczynają urozmaicać wyposażenie dodatkowe inteligentnych głośników, generalnie pod tym względem najpopularniejsze z nich są podobne, wyróżnikiem bowiem jak dotychczas jest przede wszystkim to, co jest wewnątrz standardowo w każdym takim urządzeniu. Jedną z takich różnic jest liczba mikrofonów wahająca się od dwóch do ośmiu zależnie od stopnia złożoności zaimplementowanych funkcji rozpoznawania mowy.

Cechą, która odróżnia poszczególne modele głośników, jest również funkcjonalność asystentów osobistych, takich jak Alexa, Siri czy Cortana. Wyraża się ją liczbą dostępnych umiejętności, tzw. skills w przypadku Alexy, która w połowie zeszłego roku pod tym względem znacznie górowała nad konkurencją, mając ich ponad 15 tysięcy, w porównaniu do kilkuset w przypadku Google Assistant, osobistego asystenta będącego mózgiem głośnika smart Google Home.

Kolejnym wyróżnikiem jest poziom inteligencji. Trudniej go w przypadku tych urządzeń wyrazić liczbowo, ponieważ dopiero w codziennym użytkowaniu okazuje się, jak głośnik radzi sobie z zadaniami, jakie zleca mu jego właściciel oraz czy z sensem odpowiada na pytania, które są mu zadawane. Pod tym względem znaczącą przewagę nad konkurencją mają firmy takie jak Google oraz Baidu (właściciel drugiej najpopularniejszej na świecie przeglądarki internetowej). Dzięki temu, że mają dostęp do ogromnych ilości danych generowanych przez internautów, ich systemy sztucznej inteligencji oparte na głębokim uczeniu mogą się bowiem znacznie lepiej rozwijać.

Przyszłość

Do tej pory rynek inteligentnych głośników można by określić jako raczej zamknięty w tym sensie, że usługa dostępu do inteligentnych asystentów osobistych rozwijana przez daną firmę powiązana była z konkretnym urządzeniem jej produkcji. Przewiduje się jednak, że coraz więcej z nich zacznie się otwierać na współpracę także z innymi dostawcami sprzętu.

To pozwoli tym drugim bardziej skupić się na rozwoju innowacji w tej dziedzinie. Dzięki temu w przyszłości możemy się spodziewać głośników smart w nowych odsłonach jak i innych urządzeń elektroniki użytkowej z możliwością dwukierunkowej komunikacji głosowej. Obecnie trudno jest sobie nawet wyobrazić, w jakim kierunku rozwinie się ta technologia.


    

Monika Jaworowska

Zobacz również