Jak samochody autonomiczne korzystają z technologii CNN

Jako dziecko uwielbiałem oglądać filmy animowane z samochodami, które zdawały się same prowadzić. Zaczęłam się zastanawiać, czy takie samochody mogą istnieć naprawdę i czy w środku znajdują się maleńkie roboty, które w magiczny sposób nimi sterują.

W miarę jak się starzejemy, samochody autonomiczne stają się rzeczywistością! Jestem nimi naprawdę zafascynowany. Czy rozumieją, kiedy należy się zatrzymać, na przykład na znakach stopu i czerwonych światłach? Czy w ogóle widzą zwierzęta i ludzi chodzących po drodze? A co z jazdą, gdy na zewnątrz jest już ciemno lub gdy pogoda jest deszczowa lub śnieżna?

Porozmawiajmy o samochodach autonomicznych! Są to samochody, które mogą jeździć same, bez kierowcy. Firmy takie jak Tesla i Waymo wykorzystują inteligentne techniki komputerowe, takie jak głębokie uczenie się, aby uczynić te samochody superinteligentnymi. Głębokie uczenie się pomaga samochodom robić fajne rzeczy, na przykład rozumieć znaki drogowe i bezpiecznie jeździć nawet przy fatalnej pogodzie. Wszystko polega na wykorzystaniu zaawansowanej technologii do kształtowania sposobu, w jaki będziemy się poruszać w przyszłości!

Historia

Historia samochodów autonomicznych przypomina długą, ekscytującą przygodę. Wyobraźmy sobie lata dwudzieste XX wieku, kiedy pojazdy autonomiczne były dla ludzi jeszcze tylko marzeniem. Pomysłowy umysł, Francis Houdina, wyróżnił się, tworząc samochód, który podążał za liniami drogi. Potrzebował jednak specjalnych przewodów ukrytych pod drogą, aby go poprowadzić.

Źródło: theatlantic.com

Przechodząc do lat 80. i 90., genialne umysły z Carnegie Mellon University wpadły na pomysł czegoś wielkiego. Opracowali samochody, które „widziały” za pomocą kamer, pomagając im poruszać się po ruchliwych ulicach miasta. Te samochody były jak uczeni odkrywcy, odkrywający, jak prowadzić, rozglądając się.

Następnie w 2004 roku nastąpił znaczący moment, którego akcja rozgrywała się na tle pustynnego wyzwania. Samochody autonomiczne wkroczyły na scenę, podejmując trudny wyścig – wyścig, którego nie wygrali, ale to był początek. Potraktuj to jako poligon szkoleniowy, dzięki któremu możesz stać się lepszym kierowcą.

Jednak faktyczny przełom nastąpił na przełomie 2000 i 2010 roku, kiedy do sektora motoryzacyjnego weszły największe firmy, takie jak Tesla, Uber i Google (obecnie Waymo). Google rozpoczął testowanie samochodów autonomicznych w 2009 r. W 2015 r. samochody Tesli wprowadziły funkcję, dzięki której mogły częściowo poruszać się same po określonych drogach. Mogły poradzić sobie z kierowaniem i utrzymywaniem się na drodze bez ciągłej kontroli człowieka.

W miarę jak do wyścigu przyłączało się coraz więcej firm, konkurencja w tworzeniu samochodów całkowicie autonomicznych zaostrzyła się. Wyobraź sobie zespoły wynalazców ścigających się, aby stworzyć samochody, które mogłyby jeździć bez konieczności kierowania ludźmi.

Ale historia toczy się dalej. Wciąż pracujemy nad stworzeniem samochodów, które będą mogły samodzielnie jeździć, co zmieni sposób, w jaki podróżujemy. Ta przygoda wciąż trwa, a to oznacza, że ​​możemy podróżować bezpieczniej i łatwiej, bo te fantazyjne samochody autonomiczne są coraz lepsze.

Jak działają samochody autonomiczne?

Samochody autonomiczne są jak superinteligentni decydenci! Używają kamer, LiDAR, RADAR, GPS i czujników bezwładnościowych do gromadzenia danych o swoim otoczeniu. Następnie specjalne algorytmy zwane algorytmami głębokiego uczenia się przetwarzają te dane, aby zrozumieć, co dzieje się wokół nich. Na podstawie tej wiedzy podejmują ważne decyzje dotyczące bezpiecznej i płynnej jazdy.

Źródło: arxiv.org

Jeśli chcemy dowiedzieć się, jak naprawdę działają samochody autonomiczne, przyjrzyjmy się bliżej tym czterem częściom pokazanym na powyższym schemacie. To jak układanie puzzli – zrozumienie każdego elementu pomoże nam zobaczyć szerszy obraz działania tych niesamowitych samochodów:

  • Postrzeganie
  • Lokalizacja
  • Prognoza
  • Podejmowanie decyzji
    • Planowanie ścieżki na wysokim poziomie
    • Arbitraż zachowania
    • Kontroler ruchu

Postrzeganie

#1. Kamera

Kamery są jak oczy samochodu autonomicznego – są niezwykle ważne! Pomagają samochodowi wiedzieć, co dzieje się wokół niego. Kamery te wykonują różne zadania, na przykład ustalają, co się dzieje, oddzielają różne części i ustalają, gdzie znajduje się samochód.

Aby mieć pewność, że samochód niczego nie przeoczy, kamery rozmieszczone są wszędzie – z przodu, z tyłu, po lewej i prawej stronie. Kamery te współpracują ze sobą, aby uzyskać duży obraz wszystkiego wokół samochodu. To jak specjalny widok 360 stopni z samochodu!

Te kamery nie służą tylko na pokaz. Są mądrzy. Niektórzy patrzą daleko, nawet na 200 metrów, aby samochód wiedział, co go czeka. Inni skupiają się na rzeczach znajdujących się w pobliżu, aby samochód mógł zwracać szczególną uwagę na szczegóły. Zespół kamer pomaga samochodowi wszystko zobaczyć i zrozumieć, niczym przyjaciel, który go prowadzi, dzięki czemu może bezpiecznie prowadzić i dokonywać dobrych wyborów.

Czasami kamery są bardzo pomocne, na przykład podczas parkowania, ponieważ pokazują szeroki widok i pomagają podejmować właściwe decyzje dotyczące ostrożnej jazdy.

Jednak używanie kamer wyłącznie do oglądania rzeczy stwarza problemy, szczególnie w trudnych warunkach pogodowych, takich jak mgła, ulewny deszcz i w nocy. W dzisiejszych czasach zdjęcia z kamer mogą wyglądać dziwnie i niechlujnie, co może być naprawdę niebezpieczne.

Aby poradzić sobie w tych trudnych sytuacjach, potrzebujemy specjalnych czujników, które mogą działać, gdy jest naprawdę ciemno, a nawet w całkowitej nocy. Powinni także móc mierzyć odległość od obiektów bez konieczności używania światła, które widzimy. Kiedy umieścimy te czujniki w oczach samochodu (system percepcji), samochód będzie lepiej radził sobie z jazdą przy złej pogodzie lub gdy słabo będzie widzieć. Dzięki temu samochód może jeździć bezpieczniej, co jest świetne dla każdego, kto porusza się po drodze.

#2. LiDAR

LiDAR, co oznacza wykrywanie i określanie odległości światła, to fantazyjna technologia wykorzystująca lasery do sprawdzania odległości. LiDAR wysyła wiązki laserowe i mierzy, ile czasu potrzeba, aby powrócić do rzeczywistości.

Kiedy LiDAR i kamery współpracują ze sobą, pomagają samochodowi lepiej zrozumieć sytuację. Tworzy trójwymiarową mapę otoczenia samochodu. Te specjalne informacje można następnie sprawdzić za pomocą inteligentnych programów komputerowych, które pomagają samochodowi odgadnąć, co mogą zrobić inne samochody. Jest to przydatne, gdy droga jest trudna, np. na ruchliwych skrzyżowaniach, ponieważ samochód może obserwować inne samochody i jeździć bezpiecznie.

LiDAR ma jednak ograniczenia, które mogą być problematyczne. Chociaż działa dobrze w nocy i w ciemnym otoczeniu, może borykać się z zakłóceniami powodowanymi przez deszcz lub mgłę, co może prowadzić do niedokładności percepcji. Aby rozwiązać te problemy, używamy jednocześnie czujników LiDAR i RADAR. Czujniki te dostarczają dodatkowych informacji, które pomagają samochodowi lepiej zrozumieć sytuację. Samochód może samodzielnie jeździć bezpieczniej i lepiej.

#3. RADAR

RADAR, co oznacza Radio Detection and Ranging, jest od dawna używany w życiu codziennym, a także w wojsku. Pierwotnie używany przez wojsko do wykrywania obiektów, RADAR oblicza odległości za pomocą sygnałów fal radiowych. Obecnie RADAR jest niezbędny w wielu samochodach, zwłaszcza tych autonomicznych.

RADAR jest niesamowity, ponieważ może pracować przy każdej pogodzie i świetle. Zamiast laserów wykorzystuje fale radiowe, co czyni go elastycznym i niezwykle użytecznym. Jednakże RADAR jest uważany za czujnik zakłócający, co oznacza, że ​​może wykrywać przeszkody nawet wtedy, gdy kamera ich nie widzi.

Mózg samochodu autonomicznego może zostać zdezorientowany wszystkimi dodatkowymi sygnałami z RADARU, które nazywamy „szumem”. Aby to naprawić, samochód musi wyczyścić informacje z radaru, aby móc dokonywać właściwych wyborów.

Czyszczenie danych oznacza użycie specjalnych sztuczek w celu odróżnienia silnych sygnałów od słabych, takich jak oddzielenie rzeczy ważnych od mniej ważnych. Samochód wykorzystuje sprytną sztuczkę zwaną szybką transformacją Fouriera (FFT), aby jeszcze lepiej rozumieć informacje.

RADAR i LiDAR dostarczają informacji o pojedynczych punktach, niczym kropki na papierze. Aby lepiej zrozumieć te kropki, w samochodzie zastosowano coś w rodzaju grupowania. To tak, jakbyś zestawił ze sobą podobne rzeczy. Samochód wykorzystuje sprytne metody statystyczne, takie jak grupowanie euklidesowe lub grupowanie K-średnich, aby łączyć podobne kropki i je rozumieć. Dzięki temu samochód może prowadzić mądrzej i bezpieczniej.

Lokalizacja

W samochodach autonomicznych algorytmy lokalizacji odgrywają kluczową rolę w określaniu pozycji i orientacji pojazdu podczas nawigacji, co jest znane jako odometria wizualna (VO). Funkcja VO polega na identyfikowaniu i dopasowywaniu kluczowych punktów w kolejnych klatkach wideo.

Samochód patrzy na specjalne kropki w informacjach, niczym znaki na mapie. Następnie samochód wykorzystuje statystyki zwane SLAM, aby dowiedzieć się, gdzie znajdują się rzeczy i jak się poruszają. Dzięki temu samochód wie, co jest wokół, np. drogi i ludzie.

Aby zrobić to jeszcze lepiej, samochód wykorzystuje coś, co nazywa się głębokim uczeniem. To jak superinteligentny komputer.

Te triki sprawiają, że samochód bardzo dobrze rozumie wszystko. Sieci neuronowe, takie jak PoseNet i VLocNet++, wykorzystują dane punktowe do szacowania pozycji 3D i orientacji obiektów. Te szacunkowe pozycje i orientacje 3D można następnie wykorzystać do uzyskania semantyki sceny, jak pokazano na poniższym obrazku. Kiedy samochód wykorzystuje matematyczne i inteligentne sztuczki komputerowe, wie, gdzie się znajduje i co go otacza. Dzięki temu samochód może sam jechać bezpiecznie i płynnie.

Prognoza

Zrozumienie ludzkich kierowców jest rzeczywiście złożonym zadaniem, ponieważ wiąże się z emocjami i reakcjami, a nie prostą logiką. Ponieważ nie wiemy, co zrobią inni kierowcy, w przypadku samochodów autonomicznych niezwykle ważne jest prawidłowe przewidywanie swoich zachowań. Pomaga to zapewnić bezpieczeństwo na drodze.

Wyobraź sobie, że samochody autonomiczne mają oczy dookoła, na przykład widok 360 stopni. Dzięki temu mogą widzieć wszystko, co się dzieje. Wykorzystują te informacje w procesie głębokiego uczenia się. Samochód wykorzystuje sprytne techniki, aby przewidzieć, co mogą zrobić inni kierowcy. Przypomina to grę, w której planujesz dobrze sobie radzić.

Przewidywanie przy użyciu głębokiego uczenia się

Specjalne czujniki w samochodach autonomicznych są jak ich oczy. Pomagają samochodom dowiedzieć się, co jest na zdjęciach, znaleźć rzeczy wokół nich, wiedzieć, gdzie się znajdują i zobaczyć, gdzie wszystko się kończy. Pomaga to samochodowi dowiedzieć się, co znajduje się w pobliżu i podejmować mądre decyzje.

Podczas szkolenia algorytmy głębokiego uczenia modelują złożone informacje z obrazów i punktów danych w chmurze uzyskanych z LiDAR i RADAR. Podczas rzeczywistej jazdy (wnioskowania) ten sam model pomaga samochodowi przygotować się do możliwych ruchów, w tym hamowania, zatrzymywania, zwalniania, zmiany pasa i nie tylko.

Głębokie uczenie się jest jak inteligentny pomocnik w samochodzie. Dzięki temu samochód rozumie rzeczy, których nie jest pewien, ustala swoją lokalizację i jeździ lepiej. Dzięki temu jazda jest bezpieczna i płynniejsza.

Jednak najtrudniejszą częścią jest wybranie najlepszego działania spośród kilku opcji. Wybór właściwych ruchów wymaga dokładnego przemyślenia, aby samochód mógł dobrze prowadzić i był bezpieczny.

Podejmowanie decyzji

Samochody autonomiczne muszą dokonywać ważnych wyborów w trudnych sytuacjach, ale nie jest to łatwe. Dzieje się tak dlatego, że czujniki nie zawsze działają prawidłowo, a ludzie na drodze mogą zrobić nieoczekiwane rzeczy. Samochód musi odgadnąć, co zrobią inni i ruszyć, aby uniknąć wypadku.

Aby dokonać wyboru, samochód potrzebuje wielu informacji. Samochód zbiera te informacje za pomocą czujników, a następnie wykorzystuje algorytmy głębokiego uczenia się, aby zrozumieć, gdzie się znajdują rzeczy i przewidzieć, co może się wydarzyć. Lokalizacja pomaga samochodowi poznać jego początkową pozycję, a przewidywanie generuje wiele możliwych działań w oparciu o otoczenie.

Pozostaje jednak pytanie: w jaki sposób samochód wybiera najlepsze działanie spośród wielu przewidywanych?

Źródło: semanticscholar.org

Uczenie się głębokiego wzmacniania (DRL) to technika podejmowania decyzji wykorzystująca algorytm zwany procesem decyzyjnym Markowa (MDP). MDP pomaga w odgadywaniu, jak ludzie na drodze mogą zachowywać się w przyszłości. Kiedy wokół dzieje się więcej rzeczy, sytuacja staje się bardziej skomplikowana. Oznacza to, że samochód autonomiczny musi myśleć o jeszcze większej liczbie możliwych działań.

Aby sprostać wyzwaniu znalezienia najlepszego ruchu dla samochodu, model głębokiego uczenia się jest optymalizowany przy użyciu optymalizacji Bayesa. W niektórych przypadkach do podejmowania decyzji wykorzystuje się strukturę łączącą ukryty model Markowa i optymalizację Bayesa, umożliwiając autonomicznemu samochodowi efektywną i bezpieczną nawigację w różnych złożonych scenariuszach.

Źródło: arxiv.org

Podejmowanie decyzji w samochodach autonomicznych opiera się na hierarchicznym procesie obejmującym cztery kluczowe elementy:

Planowanie trasy lub trasy: Na początku podróży samochód określa najlepszą trasę z aktualnej pozycji do wybranego miejsca docelowego. Celem jest znalezienie optymalnego rozwiązania spośród różnych możliwych tras.

Arbitraż dotyczący zachowania: Samochód musi przejechać trasę po jej zaplanowaniu. Samochód rozpoznaje obiekty statyczne, takie jak drogi i skrzyżowania, ale nie jest w stanie przewidzieć dokładnych zachowań innych kierowców. Aby poradzić sobie z tą niepewnością, do planowania używamy inteligentnych metod, takich jak procesy decyzyjne Markowa (MDP).

Scenariusz decyzji najwyższej maszyny stanu

Planowanie ruchu: Dzięki zaplanowanej trasie i warstwie zachowania określającej sposób poruszania się po niej, system planowania ruchu koordynuje ruchy samochodu. Oznacza to upewnienie się, że samochód porusza się w sposób bezpieczny i wygodny dla osób znajdujących się w środku. Bierze pod uwagę takie rzeczy, jak prędkość jazdy, zmiana pasa i otoczenie.

Sterowanie pojazdem: Ostatnim krokiem jest sterowanie pojazdem, które wykonuje ścieżkę referencyjną wygenerowaną przez system planowania ruchu, zapewniając płynne i bezpieczne poruszanie się samochodu po zamierzonej trajektorii.

Dzieląc proces decyzyjny na te różne części, samochody autonomiczne mogą dobrze i bezpiecznie jeździć w skomplikowanych miejscach. Dzięki temu pasażerowie mogą cieszyć się płynną i komfortową podróżą.

Konwolucyjne sieci neuronowe

Konwolucyjne sieci neuronowe (CNN) są szeroko stosowane w samochodach autonomicznych ze względu na ich zdolność do modelowania informacji przestrzennych, w szczególności obrazów. CNN przodują w wydobywaniu cech z obrazów, dzięki czemu są pomocne w odkrywaniu wielu różnych rzeczy.

W CNN wraz ze wzrostem głębokości sieci różne warstwy rejestrują różne wzorce. Wczesne warstwy wykrywają proste cechy, takie jak krawędzie, podczas gdy głębsze warstwy rozpoznają bardziej złożone, takie jak kształty obiektów (takie jak liście na drzewach lub opony w pojazdach). Dzięki tej zdolności adaptacyjnej sieci CNN są centralnym algorytmem w samochodach autonomicznych.

Podstawowym składnikiem CNN jest warstwa splotowa, która wykorzystuje jądro splotowe (matrycę filtra) do przetwarzania lokalnych obszarów obrazu wejściowego.

Matryca filtrów jest aktualizowana podczas szkolenia w celu uzyskania znaczących wag. Podstawową właściwością sieci CNN jest podział wag, w przypadku którego te same parametry wag są wykorzystywane do reprezentowania różnych transformacji, oszczędzając miejsce na przetwarzanie i umożliwiając różnorodne reprezentacje cech.

Dane wyjściowe warstwy splotowej są zwykle przepuszczane przez nieliniową funkcję aktywacji, taką jak Sigmoid, Tanh lub ReLU. Preferowany jest ReLU, ponieważ zbiega się szybciej niż inne. Ponadto wynik często przechodzi przez warstwę maksymalnego łączenia. Dzięki temu ważne szczegóły obrazu, takie jak tło i tekstury, zostaną zachowane.

Trzy podstawowe właściwości CNN czynią je wszechstronnymi i podstawowymi w samochodach autonomicznych:

  • Lokalne pola recepcyjne
  • Wspólne ciężary
  • Próbkowanie przestrzenne

Właściwości te redukują nadmierne dopasowanie i przechowują krytyczne reprezentacje oraz cechy kluczowe dla klasyfikacji, segmentacji, lokalizacji i innych obrazów.

Oto dwie sieci CNN, z których korzystają firmy będące pionierami samochodów autonomicznych:

  • HydraNet firmy Tesla
  • ChauffeurNet firmy Google Waymo

Dowiedz się więcej o konwolucyjnych sieciach neuronowych.

#1. HydraNet firmy Tesla

HydraNet to dynamiczna architektura wprowadzona przez Raviego i in. w 2018 r., opracowany głównie na potrzeby segmentacji semantycznej w samochodach autonomicznych. Jego kluczowym celem jest poprawa wydajności obliczeniowej podczas wnioskowania.

Koncepcja HydraNet zakłada przypisanie różnych sieci CNN, zwanych oddziałami, do określonych zadań. Każda gałąź otrzymuje różne dane wejściowe, a sieć może selektywnie wybierać, które gałęzie będą uruchamiane podczas wnioskowania, ostatecznie agregując dane wyjściowe z różnych gałęzi w celu podjęcia ostatecznej decyzji.

Hydranet Tesli

W kontekście samochodów autonomicznych dane wejściowe mogą reprezentować różne aspekty środowiska, takie jak obiekty statyczne (drzewa i poręcze drogowe), drogi i pasy ruchu, sygnalizacja świetlna itp. Dane wejściowe są uczone w oddzielnych gałęziach. Podczas wnioskowania mechanizm bramki decyduje, które gałęzie aktywować, a moduł łączący zbiera ich dane wyjściowe w celu podjęcia ostatecznej decyzji.

Wykrywanie prędkości, pasa ruchu i ruchu

Tesla dostosowała architekturę HydraNet, włączając współdzielony szkielet, aby sprostać wyzwaniom związanym z segregacją danych dla poszczególnych zadań podczas wnioskowania. Wspólny szkielet, zwykle modyfikowane bloki ResNet-50, pozwala na uczenie sieci na danych wszystkich obiektów. Głowice specyficzne dla zadań oparte na architekturze segmentacji semantycznej, takiej jak U-Net, umożliwiają modelowi przewidywanie wyników specyficznych dla każdego zadania.

HydraNet Tesli wyróżnia się możliwością wyświetlania widoku z lotu ptaka, tworząc trójwymiarową reprezentację środowiska pod dowolnym kątem. Ta zwiększona wymiarowość pomaga samochodowi w lepszej nawigacji. Co ciekawe, Tesla osiąga to bez użycia czujników LiDAR. Zamiast tego opiera się tylko na dwóch czujnikach: kamerze i radarze. Wydajność sieci HydraNet Tesli pozwala na przetwarzanie informacji z ośmiu kamer i generowanie percepcji głębi, wykazując imponujące możliwości bez potrzeby stosowania dodatkowej technologii LiDAR

#2. ChauffeurNet firmy Google Waymo

ChauffeurNet to sieć neuronowa oparta na RNN, używana przez Google Waymo do szkolenia samochodów autonomicznych przy użyciu uczenia się przez naśladownictwo. Chociaż do generowania trajektorii jazdy opiera się głównie na RNN, zawiera również komponent CNN znany jako FeatureNet.

Ta splotowa sieć cech wyodrębnia kontekstowe reprezentacje cech wspólne dla innych sieci i służy do wyodrębniania cech z systemu percepcji.

Źródło: Brama badawcza

Koncepcja ChauffeurNet polega na szkoleniu samochodu autonomicznego poprzez naśladowanie doświadczonych kierowców z wykorzystaniem uczenia się przez naśladownictwo. Aby przezwyciężyć ograniczenia wynikające z niewystarczających danych szkoleniowych ze świata rzeczywistego, autorzy artykułu „ChauffeurNet: Learning to Drive by Imitating the Best and Synthesizing the Worst” wprowadzili dane syntetyczne.

Te syntetyczne dane wprowadzają różne odchylenia, takie jak zakłócanie ścieżki trajektorii, dodawanie przeszkód i tworzenie nienaturalnych scen. Stwierdzono, że trenowanie samochodu przy użyciu danych syntetycznych jest skuteczniejsze niż korzystanie wyłącznie z danych rzeczywistych.

W ChauffeurNet system percepcji nie jest częścią kompleksowego procesu, ale działa jako system średniego poziomu. Dzięki temu sieć może przyjmować różne warianty danych wejściowych z systemu percepcji. Sieć obserwuje średniopoziomową reprezentację sceny z czujników i wykorzystując te dane wejściowe wraz z danymi syntetycznymi, imituje zachowanie kierowcy eksperta.

Uwzględniając zadanie percepcji i tworząc ogólny widok otoczenia z lotu ptaka, ChauffeurNet ułatwia łatwiejsze uczenie się transferu, umożliwiając sieci podejmowanie lepszych decyzji w oparciu zarówno o dane rzeczywiste, jak i symulowane. Sieć generuje trajektorie jazdy poprzez iteracyjne przewidywanie kolejnych punktów na ścieżce jazdy w oparciu o reprezentacje średniego poziomu. Podejście to okazało się obiecujące w zakresie skuteczniejszego szkolenia samochodów autonomicznych, zapewniając drogę do bezpieczniejszych i bardziej niezawodnych systemów jazdy autonomicznej.

#3. Częściowo obserwowalny proces decyzyjny Markowa stosowany w samochodach autonomicznych

Częściowo obserwowalny proces decyzyjny Markowa (POMDP) ​​to struktura matematyczna stosowana w kontekście samochodów autonomicznych do podejmowania decyzji w warunkach niepewności. W rzeczywistych scenariuszach samochody autonomiczne często mają ograniczone informacje o swoim otoczeniu ze względu na szum czujników, okluzje lub niedoskonałe systemy percepcji. POMDP zaprojektowano tak, aby radził sobie z taką częściową obserwowalnością i podejmował optymalne decyzje, biorąc pod uwagę zarówno niepewność, jak i dostępne obserwacje.

W POMDP agent decyzyjny działa w środowisku o stanach częściowo obserwowalnych. Agent podejmuje działanie, a środowisko przechodzi w nowe stany probabilistycznie. Jednak agent otrzymuje jedynie częściowe obserwacje lub zaszumioną informację o prawdziwym stanie środowiska. Celem jest znalezienie polityki, która maksymalizuje oczekiwaną skumulowaną nagrodę w czasie, biorąc pod uwagę niepewność otoczenia i obserwacje agenta.

Źródło: Brama badawcza

W kontekście samochodów autonomicznych POMDP jest szczególnie przydatny do zadań takich jak planowanie ruchu, przewidywanie trajektorii i interakcja z innymi użytkownikami dróg. Samochód autonomiczny może wykorzystywać POMDP do podejmowania decyzji dotyczących zmiany pasa ruchu, dostosowania prędkości oraz interakcji z pieszymi i innymi pojazdami, biorąc pod uwagę niepewność w otaczającym środowisku.

POMDP składa się z sześciu komponentów i można go oznaczyć jako POMDP

M:= (I, S, A, R, P, γ)

Gdzie,

Ja: Obserwacje

S: Skończony zbiór stanów

O: Skończony zestaw działań

R: Funkcja nagrody

P: Funkcja prawdopodobieństwa przejścia

γ: współczynnik dyskontujący przyszłe nagrody.

POMDP mogą stanowić wyzwanie obliczeniowe ze względu na konieczność uwzględnienia wielu możliwych stanów i obserwacji. Jednak często stosuje się zaawansowane algorytmy, takie jak planowanie przestrzeni przekonań i metody Monte Carlo, aby skutecznie przybliżyć optymalną politykę i umożliwić podejmowanie decyzji w czasie rzeczywistym w samochodach autonomicznych.

Włączając POMDP do swoich algorytmów podejmowania decyzji, samochody autonomiczne mogą skuteczniej i bezpieczniej poruszać się po złożonych i niepewnych środowiskach, biorąc pod uwagę niepewność odczytów czujników i podejmując świadome decyzje, aby osiągnąć zamierzone cele.

Autonomiczny samochód, pełniący funkcję agenta, uczy się poprzez interakcję z otoczeniem za pomocą uczenia się przez wzmacnianie (RL), będącego rodzajem uczenia maszynowego. Stan, działanie i nagroda to trzy ważne zmienne leżące u podstaw uczenia się przez głębokie wzmacnianie (DRL).

Stan: Opisuje aktualną sytuację samochodu autonomicznego w danym momencie, np. jego położenie na drodze.

Akcja: reprezentuje wszystkie możliwe ruchy, które może wykonać samochód, w tym decyzje takie jak zmiana pasa lub dostosowanie prędkości.

Nagroda: Przekazuje informację zwrotną samochodowi za każdym razem, gdy wykonuje on określone działanie. Nagroda może być dodatnia lub ujemna, a celem DRL jest maksymalizacja skumulowanych nagród.

W przeciwieństwie do uczenia się nadzorowanego, gdzie algorytmowi wyraźnie przydzielane są właściwe działania, DRL uczy się poprzez eksplorację środowiska i otrzymywanie nagród w oparciu o swoje działania. Sieć neuronowa autonomicznego samochodu jest szkolona na danych percepcyjnych, które obejmują cechy wyodrębnione przez splotowe sieci neuronowe (CNN).

Algorytmy DRL są następnie szkolone na tych reprezentacjach, które są niskowymiarowymi transformacjami danych wejściowych, co skutkuje bardziej efektywnym podejmowaniem decyzji podczas wnioskowania.

Szkolenie samochodów autonomicznych w rzeczywistych scenariuszach jest niebezpieczne i niepraktyczne. Zamiast tego są szkoleni w symulatorach, gdzie nie ma zagrożenia dla bezpieczeństwa ludzi.

Symulator

Niektóre symulatory typu open source to:

Łącząc dane percepcyjne z uczeniem się przez wzmacnianie, samochody autonomiczne mogą nauczyć się poruszać w skomplikowanych środowiskach, podejmować bezpieczne i optymalne decyzje oraz stać się bardziej biegłymi w radzeniu sobie ze scenariuszami jazdy w rzeczywistych warunkach.

Często zadawane pytania

Czym są pojazdy autonomiczne?

Pojazdy autonomiczne, powszechnie nazywane samochodami autonomicznymi, to samochody wyposażone w najnowocześniejsze czujniki i sztuczną inteligencję, które potrafią samodzielnie nawigować i jeździć. Pojazdy te oceniają swoje otoczenie i oceniają jazdę za pomocą kamer, LiDAR, RADAR i zaawansowanych algorytmów.

Czy pojazdy autonomiczne są bezpieczne?

Przy opracowywaniu samochodów autonomicznych bezpieczeństwo jest na pierwszym miejscu. Aby mieć pewność, że spełniają surowe przepisy bezpieczeństwa, pojazdy te przechodzą dokładne testy i symulacje. Chociaż podczas testów zdarzały się incydenty, ostatecznym celem jest uczynienie samochodów autonomicznych bezpieczniejszymi niż tych kierowanych przez człowieka.

Czy pojazdami autonomicznymi można jeździć przy każdej pogodzie?

Ekstremalne warunki pogodowe, w tym ulewne deszcze lub śnieg, mogą stanowić problemy dla samochodów autonomicznych. Niekorzystna pogoda może zmniejszyć dokładność czujników i pogorszyć zdolność prowadzenia pojazdu. Inżynierowie nieustannie starają się, aby technologia działała lepiej w niesprzyjających warunkach pogodowych.

Pojazdy autonomiczne – czy są dozwolone?

Legalność pojazdów autonomicznych różni się w zależności od kraju i lokalizacji. Aby dostosować się do pojazdów autonomicznych, wiele jurysdykcji zmienia swoje przepisy i regulacje. Testowanie samochodów autonomicznych i ich ograniczone wdrażanie są już dozwolone w niektórych obszarach.

Czy pojazdy autonomiczne wymagają interwencji człowieka?

Większość dostępnych obecnie samochodów autonomicznych ma stopień automatyzacji 2 lub 3, gdzie czasami mogą potrzebować pomocy człowieka. Przemysł dąży jednak do osiągnięcia wyższych poziomów automatyzacji, takich jak poziom 4 lub poziom 5, gdzie interwencja człowieka staje się minimalna lub niepotrzebna.

Wniosek

Podsumowując, samochody autonomiczne mogą przekształcić przemysł motoryzacyjny poprzez poprawę wydajności i bezpieczeństwa na drogach. Przyjrzeliśmy się wszystkim niezbędnym komponentom obsługującym te autonomiczne samochody, w tym LiDAR, RADAR, kamerom i zaawansowanym algorytmom.

Chociaż postęp jest obiecujący, nadal istnieją ważne wyzwania, którym należy stawić czoła. Obecnie samochody autonomiczne znajdują się na poziomie 2 z 5, co wymaga interwencji człowieka w niektórych scenariuszach. Jednak dzięki ciągłemu zaangażowaniu i innowacjom jesteśmy coraz bliżej osiągnięcia pełnej autonomii.

Udoskonalanie algorytmów: Dalsza optymalizacja algorytmów ma kluczowe znaczenie dla poprawy percepcji drogi, szczególnie w trudnych warunkach, gdzie może brakować oznakowań i znaków drogowych.

Udoskonalanie modalności wykrywania: Poprawa dokładności i wydajności modalności wykrywania na potrzeby mapowania i lokalizacji będzie kluczowa dla osiągnięcia wyższego poziomu autonomii.

Komunikacja między pojazdami: utworzenie połączonego i inteligentnego ekosystemu drogowego będzie możliwe dzięki rozwojowi komunikacji między pojazdami.

Interakcja człowiek-maszyna: Zwiększanie akceptacji społecznej technologii autonomicznego prowadzenia będzie wymagało zbadania i rozwiązania kwestii związanych z interakcją człowiek-maszyna.

Perspektywy na przyszłość: Pomimo trudności dotychczasowe osiągnięcia są niezwykłe, a dzięki ciągłej współpracy i badaniom samochody autonomiczne oferują potencjał zapewnienia wszystkim bezpieczniejszego i bardziej efektywnego środowiska transportu.

Wszyscy podążamy tą samą drogą w kierunku całkowicie autonomicznych samochodów autonomicznych. Rozwiązując wyzwania i pobudzając innowacje, zbliżamy się do czasów, gdy pojazdy sprawnie poruszają się po naszych drogach, poprawiając bezpieczeństwo, środowisko i wygodę dla wszystkich.

Możesz teraz dowiedzieć się o obliczeniach przestrzennych i ich zastosowaniu w projektowaniu samochodów autonomicznych.