Wprowadzenie do sieci neuronowych [+ 5 Learning Resources]

Sieci neuronowe zostały opracowane w celu odtworzenia skomplikowanych połączeń neuronów ludzkiego układu nerwowego.

Uważano, że skoro biologiczny układ nerwowy jest tak wydajny w przekazywaniu i przetwarzaniu sygnałów, może pomóc w stworzeniu ludzkiej inteligencji dla maszyn.

Doprowadziło to do stworzenia sieci sztucznych neuronów, które mogą przetwarzać i przesyłać dane, podobnie jak skupisko neuronów w ludzkim mózgu.

Zapewniło to znacznie zwiększoną zdolność maszyn do uczenia się i inteligentnego reagowania, stąd narodziny sieci neuronowych.

W tym artykule omówię sieci neuronowe, sposób ich działania, ich zalety i inne ważne aspekty.

Zaczynajmy!

Czym są sieci neuronowe?

Źródło obrazu: Tibco.com

Sieci neuronowe lub sztuczne sieci neuronowe (ANN) są częścią sztucznej inteligencji (AI) i uczenia maszynowego (ML), które uczą maszyny/komputery przetwarzać informacje, tak jak biologiczny mózg. Sieć ma system adaptacyjny, który pozwala jej uczyć się na podstawie poprzednich działań i ciągle się doskonalić.

Sieci neuronowe są podgrupą uczenia maszynowego, a ich rdzeń jest rozwijany przy użyciu algorytmów głębokiego uczenia. Nazwa „sieć neuronowa” jest inspirowana skomplikowaną siecią neuronów w ludzkim mózgu i sposobem, w jaki neurony się komunikują.

Sieć neuronowa wykorzystuje swoje dane treningowe jako dane wejściowe do wspierania uczenia się i zwiększania swoich możliwości. Zapewnia ciągłe uczenie się na podstawie danych z przeszłości z coraz większą dokładnością, dzięki czemu jest potężnym, nowoczesnym narzędziem.

Historia sieci neuronowych sięga pierwszej ery komputerów. Pierwsza instancja sieci neuronowej została zaprojektowana przez Warrena McCullocha jako system obwodów, który może przybliżać funkcję ludzkiego mózgu.

W 1958 roku Frank Rosenblatt opracował pierwszy przypadek sztucznej percepcji. W 1982 roku John Hopfield opublikował artykuł na temat „rekurencyjnych sieci neuronowych”. Sieci neuronowe były szeroko stosowane w 1988 roku w dziedzinie badań nad białkami.

Technologia została wykorzystana do przewidywania trójwymiarowych kształtów białek. Do roku 1992 opracowano algorytm rozpoznawania obiektów 3D.

Obecnie sieci neuronowe stały się bardzo zaawansowane. Są wykorzystywane w wielu sektorach, od opieki zdrowotnej, lotnictwa i obrony po cyberbezpieczeństwo, marketing i prognozy pogody.

Jak działają sieci neuronowe?

Jak wyjaśniono powyżej, rozwój sieci neuronowej został zainspirowany ludzkim mózgiem pod względem architektury neuronowej. Neurony ludzkiego mózgu mogą tworzyć złożoną i silnie połączoną sieć, przez którą przesyłane są sygnały i przetwarzane są informacje. Działa to jako funkcja neuronów replikowanych przez sieci neuronowe.

Podstawową metodą działania sieci neuronowych jest wzajemne powiązanie wielu różnych warstw neuronów w sieci. Każdy neuron jest połączony z innym za pośrednictwem węzła.

Może odbierać dane wejściowe z poprzedniej warstwy i wysyłać dane wyjściowe, które są następnie przekazywane do warstwy. Ten krok powtarza się do momentu podjęcia decyzji lub prognozy przez ostatnią warstwę.

Działanie sieci neuronowej można lepiej zrozumieć w kategoriach poszczególnych mechanizmów każdej warstwy sieci, przez którą przechodzą dane i są przetwarzane. W podstawowej strukturze istnieją trzy warstwy – wejściowa, ukryta i wyjściowa.

Warstwa wejściowa

Ta warstwa sieci neuronowej odpowiada za zbieranie danych ze świata zewnętrznego. Po zebraniu danych warstwa przetwarza również te dane, analizuje zawartość danych i dodaje kategorię do danych w celu lepszej identyfikacji. Następnie przesyła dane do następnej warstwy.

Ukryta warstwa

Dane z warstwy ukrytej pochodzą z warstwy wejściowej i innych warstw ukrytych. W sieci neuronowej może występować duża liczba ukrytych warstw. Każda z ukrytych warstw może analizować dane wejściowe przekazane z poprzedniej warstwy. Dane wejściowe są następnie przetwarzane, a następnie przekazywane dalej.

Warstwa wyjściowa

Dane przekazywane z ostatniej warstwy ukrytej docierają do warstwy wyjściowej. Ta warstwa pokazuje końcowy wynik przetwarzania danych, które ma miejsce w poprzednich warstwach sieci neuronowej. Warstwa wyjściowa może mieć jeden lub więcej węzłów w zależności od danych wejściowych.

Na przykład w przypadku danych binarnych (1/0, Tak/Nie) zostanie użyty pojedynczy węzeł wyjściowy. Jednak w przypadku danych z wielu kategorii będzie używanych wiele węzłów.

Warstwa ukryta to zasadniczo sieć głębokiego uczenia się połączeń między kilkoma węzłami. Połączenie węzła jest reprezentowane przez liczbę zwaną „wagą”. Reprezentuje, jak bardzo węzeł może wpływać na inne węzły. Wartość dodatnia wskazuje na zdolność do wzbudzenia innego węzła, natomiast wartość ujemna wskazuje na zdolność do tłumienia innego węzła.

Rodzaje sieci neuronowych

Do różnych typów zastosowań i danych stosuje się różne typy sieci neuronowych, z których każda ma inną architekturę. Oto niektóre rodzaje sieci neuronowych:

# 1. Sieć Feed Forward

W tego typu sieciach neuronowych występuje wiele połączonych ze sobą warstw ukrytych i neuronów. Tutaj przepływ informacji odbywa się tylko w kierunku do przodu, bez propagacji wstecznej, stąd nazwa „feedforward”. Większa ilość tej warstwy pomaga w dostosowaniu wagi; a co za tym idzie uczenie się.

#2. Perceptron

Jest to najbardziej podstawowa forma sieci, która składa się tylko z 1 neuronu. Neuron stosuje funkcję aktywacji do wejścia, aby uzyskać wyjście binarne. Zasadniczo dodaje wartość wejściową i wagę węzła i przekazuje sumę do funkcji aktywacji, aby utworzyć dane wyjściowe. Ukryte warstwy są nieobecne w tego typu sieciach.

#3. Perceptron wielowarstwowy

Ten typ sieci neuronowej umożliwia wsteczną propagację, która nie jest obsługiwana w systemie sprzężenia zwrotnego. Obejmuje to kilka ukrytych warstw i funkcji aktywacji, które umożliwiają dwukierunkowy przepływ danych. Dane wejściowe są propagowane do przodu, podczas gdy aktualizacje wagi są propagowane wstecz. W zależności od celu można zmienić funkcję aktywacji.

#4. Radialna sieć bazowa

Ta kategoria sieci wykorzystuje warstwę neuronów Radial Basis Function (RBF) między warstwami wejściową i wyjściową. Te neurony mogą przechowywać klasy różnych danych treningowych, wykorzystując w ten sposób inny sposób przewidywania celów. Neuron porównuje odległości euklidesowe z faktycznie zapamiętanymi klasami z wartości cechy wejścia.

#5. Sieć konwolucyjna

Ta sieć neuronowa zawiera wiele warstw splotów, które identyfikują ważne cechy z danych wejściowych, takich jak obrazy. Kilka pierwszych warstw koncentruje się na szczegółach niskiego poziomu, podczas gdy kolejne warstwy koncentrują się na szczegółach wysokiego poziomu. Ta sieć używa niestandardowej matrycy lub filtra do tworzenia map.

#6. Sieć cykliczna

Ta sieć jest używana, gdy istnieje wymóg uzyskania predykcji z danej sekwencji danych. Może to wymagać opóźnionych w czasie danych wejściowych ostatniej prognozy. Jest to przechowywane w komórce danych RNN, która z kolei działa jako drugie wejście używane do prognozowania.

#7. Sieć pamięci krótkotrwałej

W tego typu sieciach neuronowych dodatkowa specjalna komórka pamięci służy do przechowywania informacji przez dłuższy czas i przezwyciężenia problemu znikających gradientów. Bramki logiczne służą do identyfikacji wyjść, które należy wykorzystać lub wyrzucić. Tak więc trzy bramki logiczne użyte w tym to – Wejście, Wyjście i Zapomnij.

Korzyści z sieci neuronowych

Sieci neuronowe oferują wiele korzyści:

Ze względu na swoją strukturę może przetwarzać dane i uczyć się złożonych i nieliniowych relacji dotyczących świata rzeczywistego oraz uogólniać swoją wiedzę w celu tworzenia nowych wyników.
Sieci neuronowe nie mają ograniczeń na wejściach. W ten sposób mogą modelować heteroskedastyczność, dzięki której może dowiedzieć się o ukrytych relacjach między danymi.
Sieć neuronowa może przechowywać dane w całej sieci i pracować na niewystarczających danych. Tworzy to nadmiarowość danych i zmniejsza ryzyko utraty danych.

Dzięki nadmiarowym połączeniom jest w stanie przetwarzać wiele danych jednocześnie i równolegle. Oznacza to, że sieci neuronowe mogą pomóc w wykonywaniu wielu funkcji jednocześnie.
Możliwość dostosowania przetwarzania danych zapewnia mu wysoką tolerancję na błędy i szkoli się w celu ciągłego doskonalenia.
Ponieważ sieć wykorzystuje pamięć rozproszoną, jest odporna na uszkodzenia danych.
Może uczyć się na podstawie przeszłych wydarzeń, na podstawie których może szkolić maszyny, aby podejmowały lepsze decyzje.

Zastosowania sieci neuronowych

Przewidywanie wyników giełdowych: Wielowarstwowy Perceptron jest często używany do przewidywania wyników giełdowych i przygotowywania się na zmiany giełdowe. System tworzy prognozy na podstawie wskaźników zysku, rocznych zwrotów i danych dotyczących wyników z rynku giełdowego w przeszłości.

Rozpoznawanie twarzy: sieci splotowe są używane do uruchamiania systemu rozpoznawania twarzy, który dopasowuje dany identyfikator twarzy do listy identyfikatorów twarzy w bazie danych, aby pokazać pozytywne dopasowanie.
Badanie zachowania w mediach społecznościowych: Multiplayer Perceptron może być używany do badania zachowań ludzi w mediach społecznościowych na podstawie wirtualnych rozmów i interakcji w mediach społecznościowych. Dane te mogą być wykorzystywane w działaniach marketingowych.
Badania lotnicze: sieci opóźnienia czasowego mogą być wykorzystywane w różnych dziedzinach aeronautyki, takich jak rozpoznawanie wzorców, zabezpieczanie systemów sterowania, wysokowydajny autopilot, diagnostyka usterek samolotów i opracowywanie symulacji. Pomaga to udoskonalić praktyki w zakresie bezpieczeństwa i ochrony w branży.
Planowanie obrony: Strategie obrony można uzyskiwać i opracowywać za pomocą sieci neuronowych. Technologię można wykorzystać do przewidywania zagrożeń obronnych, kontrolowania zautomatyzowanego sprzętu i identyfikowania potencjalnych miejsc do patrolowania.
Opieka zdrowotna: Sieć może być wykorzystywana do tworzenia lepszych technik obrazowania dla ultrasonografii, tomografii komputerowej i prześwietleń rentgenowskich. Może to również pomóc w lepszym rejestrowaniu i śledzeniu danych pacjenta.
Weryfikacja tożsamości: Wzory pisma odręcznego można zidentyfikować za pomocą sieci neuronowych. Może to pomóc zidentyfikować potencjalne dowody fałszerstwa za pomocą systemów weryfikacji pisma ręcznego i podpisów.
Prognozowanie pogody: Dane z satelitów pogodowych mogą być wykorzystywane do dynamicznego modelowania i prognozowania wzorców pogodowych z większą dokładnością. Może to pomóc w stworzeniu wczesnego ostrzegania przed klęskami żywiołowymi, aby można było na czas podjąć środki zapobiegawcze.

Zasoby edukacyjne

# 1. Deep Learning AZ od Udemy

Deep Learning AZ od Udemy pomoże Ci nauczyć się używać Pythona i tworzyć algorytmy Deep Learning. Kurs trwa 22 godziny i 33 minuty.

Kurs nauczy studentów:

Lepsze zrozumienie koncepcji sztucznej inteligencji, sieci neuronowych, samoorganizujących się map, maszyny Boltzmanna i autoenkoderów.
Jak zastosować te technologie w praktyce w prawdziwym świecie.

Cena kursu to 39,98 $.

#2. Data Science od Udemy

Data Science to doskonały kurs na temat głębokiego uczenia się i sieci neuronowych, który zapewnia dogłębne omówienie teorii sieci neuronowych stosowanych w uczeniu maszynowym. Ten kurs jest również oferowany przez Udemy. Jego czas trwania wynosi 12 godzin.

Kurs nauczy:

O głębokim uczeniu i funkcjach sieci neuronowych
Tworzenie kodu dla sieci neuronowych od podstaw

Cena kursu to 35,13 $.

#3. Tworzenie sieci neuronowych przez Udemy

Kurs Udemy Budowanie sieci neuronowych w języku Python od podstaw umożliwia uczniowi rozwijanie głębokiego uczenia i uczenia maszynowego przy użyciu gradientu i regresji liniowej. Czas trwania kursu to 3 godziny i 6 minut.

Kurs nauczy:

O podstawowych funkcjach sieci neuronowych, takich jak regresja liniowa, wsteczna propagacja i funkcja kosztu
Aby trenować sieci neuronowe, klasyfikować je, dostosowywać tempo uczenia się, normalizować dane wejściowe i optymalizować ich dokładność.

Cena kursu to 31,50 $.

#4. Sieci neuronowe i uczenie głębokie autorstwa Coursera

Kurs Sieci neuronowe i głębokie uczenie się jest oferowany przez Coursera. Jest to pierwszy kurs specjalizujący się w głębokim uczeniu się i skupiający się na podstawowych koncepcjach. Czas trwania kursu to 25 godzin.

Kurs nauczy:

Zapoznanie się z ważnymi trendami technologicznymi, które napędzają rozwój głębokiego uczenia
Dowiedz się, jak trenować głębokie uczenie się i wykorzystywać je do tworzenia w pełni połączonej sieci.

Ten kurs jest oferowany bezpłatnie.

#5. Budowanie zaawansowanego uczenia głębokiego i NLP

Kurs Building Advanced Deep Learning and NLP jest oferowany przez firmę Educative. Kurs trwa około 5 godzin.

Kurs nauczy:

Pracuj w praktycznych środowiskach kodowania
Poznaj koncepcje głębokiego uczenia się i przećwicz projekty związane z przetwarzaniem języka naturalnego (NLP) i zaawansowanym głębokim uczeniem się

Cena kursu wynosi 9,09 USD miesięcznie.

#6. Projekty sieci neuronowych w Pythonie:

Ta książka Jamesa Loya to doskonały przewodnik po tym, jak używać Pythona i odkrywać moc sztucznych sieci neuronowych. Sprawi, że nauczysz się i zaimplementujesz sieci neuronowe za pomocą sześciu projektów w Pythonie wykorzystujących sieci neuronowe. Ukończenie tego projektu pomoże Ci zbudować portfolio ML.

Kurs nauczy:

Architektury sieci neuronowych, takie jak LSTM i CNN
Aby korzystać z popularnych bibliotek, takich jak Keras
Projekty obejmują analizę sentymentu, identyfikację twarzy, wykrywanie obiektów itp.

#7. Sieci neuronowe i głębokie uczenie się

Ta książka autorstwa Charu C. Aggarwal obejmuje nowoczesne i klasyczne modele głębokiego uczenia się. Nauczy Cię algorytmów i teorii głębokiego uczenia i sieci neuronowych, abyś mógł zastosować je w kilku aplikacjach.

Obejmuje również aplikacje, takie jak systemy rekomendacji, podpisy i klasyfikacja obrazów, analiza tekstu, tłumaczenie maszynowe, gry i inne.

Nauczysz się:

Podstawy sieci neuronowych
Podstawy sieci neuronowych
Zaawansowane tematy dotyczące sieci neuronowych, takie jak sieci GAN, neuronowe maszyny Turinga itp.

Wniosek

Sieci neuronowe są zasadniczo częścią sztucznej inteligencji, która wspiera uczenie się w sposób zbliżony do ludzkiej inteligencji. Składają się one z wielu warstw, z których każda ma własną funkcję i dane wyjściowe. Biorąc pod uwagę ich zalety, takie jak dokładność, możliwości przetwarzania danych, obliczenia równoległe itp., zastosowania sieci neuronowych rosną w wielu sektorach do przewidywania i podejmowania mądrzejszych decyzji.

Możesz także zbadać konwolucyjne sieci neuronowe.