Systemy elektroniczne powoli otwierają oczy
| Gospodarka ArtykułyWzrok jest nam bardzo potrzebny, bez niego jesteśmy niemal bezradni. Obecnie jesteśmy w centrum nowej rewolucji technicznej - rozwoju wzroku układów elektronicznych. Większa część nowych właściwości elektroniki obejmuje wideokamery.
Pierwszym odruchem po rannym przebudzeniu jest otwarcie oczu, a ostatnim przed zaśnięciem jest ich zamknięcie. Historia wzroku sięga przeszło 270 milionów lat wstecz. To trylobity były pierwszą gromadą, która dobrze rozwinęła ten nowy sposób postrzegania. Okazał się potężny. Posiłkowanie się wzrokiem ułatwiało poszukiwanie pokarmu, dbanie o potomstwo, ochronę przed zagrożeniami. Ten zmysł prawdopodobnie przyczynił się do tzw. eksplozji kambryjskiej, okresu znacznego zwiększenia liczby nowych gatunków zwierząt.
W domu pięcioosobowej rodziny można znaleźć około trzydziestu kamer, po dwie w każdym smartfonie i tablecie, po jednej w każdym laptopie, kilka w cyfrowych fotoaparatach, nie licząc tych, które wraz ze starymi telefonami komórkowymi jeszcze oczekują na recykling.
Więc oczy w elektronice są obecne. Są małe rozmiarowo - kamera do selfie to tylko kilka milimetrów kwadratowych - a kosztując kilkadziesiąt złotych, wykonuje fotografie wysokiej jakości. Współczesne kamery służą do tworzenia, przechowywania i rozsyłania obrazów. Następnym krokiem będzie konstruowanie kamer rozumiejących - choćby nie w pełni - obserwowane widoki, interpretujących je i na podstawie zebranych informacji inicjujących działania.
Nie całkiem jednak wiadomo, jak taki system miałby działać. A człowiek? Jak w ułamku sekundy rozpoznaje osobę na fotografii? Jak czyta teksty niezależnie od czcionki, jaką zostały złożone? Jak prowadzi samochód po ciemku w deszczu albo powoli pośród tłumu pieszych na ruchliwej ulicy?
Na szczęście dokonano ostatnio znacznego postępu. Dotychczas algorytmy rozpoznawania obrazów musiały być budowane drobiazgowo, krok po kroku - praca ciężka, a wyniki nieoszałamiające. Ale przełom nastąpił dzięki stosowaniu złożonych sieci neuronowych.
Główną zaletą tej techniki jest po prostu uczenie tych sieci licznymi przykładami. Sieci te ponadto znacznie teraz lepiej i dokładniej rozpoznają i uogólniają obrazy, niż to było kilka lat temu możliwe. W niektórych zadaniach rozpoznawczych rywalizują nawet z możliwościami człowieka. Łącząc tę technologię z bardziej opartej się na klasycznej matematyce z techniką przetwarzania obrazów, jak algorytmy przepływu optycznego czy SLAM (Simultaneous Localization and Mapping), które wykrywają lokalizację i przemieszczanie się obrazów, można już budować potężne i inteligentne systemy, rozumiejące to, co widzą.
Jednakże te techniki przetwarzania wymagają dużych mocy obliczeniowych i wielkich pamięci. Według neurologów człowiek tylko na przetwarzanie widzenia zużywa około połowy mocy przerobowej mózgu. Na szczęście, zgodnie z prawem Moore'a, krzemowa moc obliczeniowa wzrasta nieustannie. Niemniej sieci neuronowe wymagają ogromnych klastrów obliczeniowych.
Obecne oczekiwania nie są już rozwojowo-badawcze, tylko sprzętowo-projektowe. Do rozwiązywania problemów obliczeniowych potrzebne są specjalne wbudowane procesory wizyjne, korzystające z tranzystorów znacznie skuteczniej niż standardowe CPU czy GPU. Potrzebne są odpowiednie narzędzia projektanckie do zmniejszania i optymalizowania sieci neuronowych oraz zasobów obliczeniowych i pamięciowych, niepogarszające zadań detekcyjnych. A narzędzia software'owe powinny zostać tak udoskonalone, aby ułatwić użycie i implementację oprogramowania przetwarzania obrazów do obniżenia mocy i kosztów krzemu. Zwiększenie sprawności krzemu i narzędzi przetwarzania wizualnego to jest właśnie to, nad czym od wielu lat pracuje się w "videantis". Mamy satysfakcję, że nasza technologia jest szybko akceptowana przez rynek.
Ale nadal jesteśmy na początku tej drogi i jeszcze trzeba wiele dobrych produktów, pomysłów i strategii do wykorzystania elektronicznego wzroku. Mamy oczywiście świadomość, że z właściwymi oczami samochody będą mogły jeździć same, a drony automatycznie dostarczać paczki i posiłki. A co z kamerami obserwującymi nas samych, czy jesteśmy zdrowi? Co z pralkami wiedzącymi, kiedy pranie jest już czyste, kuchenkami zapobiegającymi przypaleniu potraw? Możliwości są nieskończone.