11 najlepszych zasobów dotyczących nauki o danych i uczenia maszynowego

Dane to nowy olej. A uczenie maszynowe to ogień. Ktokolwiek kontroluje tych dwoje, będzie kontrolował świat.

Nie, powyższe nie jest jakimś pompatycznym zwrotem zaczerpniętym z dystopijnej powieści.

To rzeczywistość.

Nowy porządek świata polega na gromadzeniu ogromnych ilości istotnych danych i przetwarzaniu ich na praktyczne spostrzeżenia – coś, czego ludzkość nie była w stanie zrobić w historii. To rodzaj technologii, która pozwala krajowi wyprzedzić innych i ostatecznie rządzić światem.

W rezultacie postępowe narody świata traktują to bardzo, bardzo poważnie.

Lukratywny wybór kariery

Pomijając międzynarodowe intrygi, nauka o danych i uczenie maszynowe to nowa, gorąca dziedzina z niesamowitymi możliwościami. Popyt jest poza wykresami (delikatnie mówiąc) i nie ma wystarczającej liczby naukowców zajmujących się danymi. Nawet przeciętne.

To tak, jakbyśmy nagle odkryli wiele nowych planet nadających się do zamieszkania i nie ma wystarczająco dużo ludzi, aby je przenieść. Mógłbym gadać i brzmieć jak zdarta płyta, ale myślę, że ta infografika sprawdza się znacznie lepiej:

Źródło: insidebigdata.com

Widzimy więc, że pensje zaczynają się od 50 000 $+, a dla menedżerów mogą sięgać znacznie powyżej 250 000 $.

I nie tylko to, przeciętny człowiek na tej planecie będzie generował 1,7 MB danych na sekundę. To ponad 3500 TB danych w całym okresie życia — więcej danych, niż obecnie wiemy, jak sobie z nimi radzić, nie mówiąc już o wykorzystaniu do analizy. Powiedzenie, że przyszłość jest świetlana, wyrządziłoby krzywdę temu wspaniałemu nowemu pastwisku.

Czy nauka o danych i uczenie maszynowe są trudne?

Dobre pytanie!

Z mojego doświadczenia wynika, że ​​odpowiedź brzmi zarówno „tak”, jak i „nie”.

Sztuczna inteligencja (a co za tym idzie, uczenie maszynowe) jest najtrudniejszą rzeczą do zrobienia, jeśli masz ochotę na badania i przesuwanie koperty. Za taką pracę nawet doktorat. w informatyce i matematyce to za mało. Ale przecież przeciętny człowiek nie ma ani ambicji, ani czasu na takie dążenie.

Z drugiej strony jest to, co nazwałbym Applied Data Science i Machine Learning.

Oznacza to, że bierzesz istniejące narzędzia, techniki i algorytmy i stosujesz je do rozwiązywania niektórych rzeczywistych problemów. Ta część wymaga poświęcenia, percepcji i kreatywnego myślenia (oraz znajomości kilku prostych pojęć matematycznych, których się szybko uczy), ale jeśli chodzi o prawdziwą wiedzę „techniczną”, jest ona znacznie łagodniejsza niż to, co nazywa praca inżyniera oprogramowania.

Innymi słowy, to nie jest bułka z masłem, ale trzymanie się stosunku nagrody do wysiłku jest jedną z najlepszych dostępnych inwestycji.

Teraz, gdy zaostrzyłeś swoje postanowienie, aby zostać naukowcem danych i inżynierem uczenia maszynowego, zacznijmy badać najlepsze dostępne opcje.

Uczenie maszynowe (Google)

Niewiele osób zdaje sobie z tego sprawę, ale Google ma obszerne, bardzo praktyczne i darmowy kurs na Machine Learning. Według firmy jest to część ich zaangażowania w rozwój technologii AI/ML i utrzymywanie wiedzy w otwartej przestrzeni.

Najlepszą rzeczą w tym kursie jest to, że nie ma żadnych wymagań wstępnych, ale przygotuj się, aby spędzić dodatkowy czas na samodzielnym odkrywaniu koncepcji statystyk.

To znaczy, nie jest to potrzebne, ale jeśli nie masz żadnych podstaw w zaawansowanych statystykach, wyjaśnienia w tym kursie mogą nie wystarczyć. Kolejnym haczykiem jest to, że ten kurs wprowadza uczenie maszynowe za pośrednictwem Przepływ Tensora, czyli implementacja ML opracowana przez Google. W pewnym sensie Google dąży do promowania swoich interfejsów API dla uczenia maszynowego, ale biorąc pod uwagę wartość oferowaną przez ten kurs, nie widzę, jak powinno to być przeszkodą.

Jeśli już, TensorFlow jest jednym z łatwych sposobów na wejście do ML i cieszy się ogromną popularnością (porównanie frameworków AI, zobacz tutaj).

Nauka o danych

Nazwa Harvard budzi podziw, podobnie jak ten kurs.

Po pierwsze: nie jest to kurs typu „pobrudźmy się szybko”, w którym poruszasz się na palcach po uczeniu maszynowym, pisząc tutaj fragment lub skrypt. Ten kurs to ciężki chrzest ogniowy, który wymaga ciężkiej pracy i znacznej inwestycji czasu.

Kurs zawiera bezpłatne filmy, kod (hostowany na GitHub) i rozwiązania do ćwiczeń laboratoryjnych, więc praktycznie nie jesteś skrępowany niczym, jeśli chcesz to zrobić.

Idealna publiczność?

Ty… nie żartuję.

Powiedziałbym, że pracujący profesjonaliści z przyzwoitym wykształceniem matematycznym, mimo że mogą już nie interesować się matematyką (najbardziej potrzebne są nawyki wnioskowania i dowodu). Ale jeszcze raz ostrzegaj: możesz myśleć, że jesteś dobry, ale ten kurs będzie jak stwardniałe paznokcie na śniadanie — problemy z praktyką są wystarczająco trudne, by sprawić, że będziesz płakać, ale z drugiej strony może to być właśnie to, czego szukasz”. szukam!

Nauczanie maszynowe

Wejdź do baru pełnego naukowców zajmujących się danymi i zapytaj, kim jest Andrew Ng, a dostaniesz bicie swojego życia.

W kręgach nauki o danych i uczenia maszynowego Andrew Ng osiągnął boski status dzięki swojemu wyjątkowemu kursowi na Coursera — Nauczanie maszynowe.

A jeśli wątpisz w referencje Andrew Ng, pozwolę, aby to przemówiło samo za siebie:

Jest to płatny kurs, ponieważ jest częścią planu cenowego Coursera, ale zaangażowanie finansowe i determinacja nie są jedynymi warunkami wstępnymi. Jest to długi kurs, ponieważ Andrew zagłębia się w matematykę stojącą za wszystkimi rzeczami ML i analizuje popularne algorytmy. Ale na szczęście jest to kompletny kurs i zostaniesz poprowadzony krok po kroku w najciemniejsze głębiny i sprowadzony z powrotem.

Gorąco polecam, głównie dlatego, że obnoszenie się z certyfikatem ukończenia tego kursu stało się dzisiaj rzeczą!

Stosowana nauka o danych

Specjalizacje na Coursera składają się z serii kursów, których celem jest przejście od zera do biegłości w określonej koncepcji. Jeśli szukasz kompletnego, poważnego, ale przyjaznego kursu na temat Data Science i uczenia maszynowego w Pythonie, nie mogę tego polecić specjalizacja wystarczająco.

Na koniec kursu zdobywasz certyfikat.

DataCamp

DataCamp oferuje wiele kursów z zakresu analityki danych, które obejmują również kilka umiejętności i ścieżek kariery. Od manipulacji danymi po uczenie maszynowe, zdobędziesz umiejętności budowania kariery w zakresie data science w Pythonie i R, które pomogą Ci odnieść sukces w dziedzinie nauki o danych.

Dzięki zawartości DataCamp o rozmiarze bajtów możesz uczyć się we własnym tempie. Kursy te zapewniają praktyczne doświadczenie, dzięki któremu rozwiniesz swoje umiejętności w zakresie analizy danych.

Możesz zacząć od darmowej wersji i ocenić kurs patrząc na pierwszy rozdział.

edX

Ucz się od MITx, Harvardx, IBM, RICEx, UCSanDiegox i GTx na platforma edX.

Wszystkie z nich mają kompleksowy program nauczania, który pomaga w opanowaniu umiejętności analityka danych. Programy te najlepiej nadają się dla tych, którzy mają doświadczenie w statystykach lub informatyce.

Jeśli nie szukasz programu, możesz wybrać ala-carte. Na edX znajdziesz ponad 200 kursów związanych z nauką o danych, które obejmują Python, R, Excel, prawdopodobieństwo, statystykę, uczenie maszynowe, wizualizację danych i wiele innych.

Akademia kodowania

Codecademy to kolejna platforma, która jest jednym z najlepszych systemów, które pomagają w nauce kodowania. Wierzą w „uczenie się przez działanie” i mają na swojej platformie mnóstwo projektów praktycznych i testów.

The kurs nauki o danych oferowane przez Codecademy obejmują SQL, Python 3, NumPy, Pandas, Matplotlib, Scikit-learn i wiele innych bibliotek.

Cała ścieżka kariery zawiera 26 kursów, które są więcej niż wystarczające, aby pomóc Ci zostać odnoszącym sukcesy naukowcem danych.

Ten kurs danych:

  • Daje dogłębną wiedzę z zakresu data science
  • Zapewnia łatwą do śledzenia mapę drogową
  • Sprawia, że ​​jesteś gotowy do pracy, pomagając ci zdobyć wystarczającą ilość praktycznego doświadczenia

Udemy

Udemy nie trzeba przedstawiać.

Python dla nauki o danych i uczenia maszynowego Bootcamp na Udemy jest jednym z najpopularniejszych kursów z oceną ponad 85 tys.+ 4,6, w którym uczestniczyło ponad 370 tys. studentów na całym świecie.

Poniżej znajdują się tematy poruszane w tym kursie:

Poniżej znajdują się funkcje/dostawy tego kursu:

  • 25 godzin filmów na żądanie
  • Pełny dożywotni dostęp
  • 13 artykułów i pięć zasobów do pobrania
  • Dostęp przez telefon komórkowy i telewizję
  • Świadectwo ukończenia
  • 30 dniowa gwarancja zwrotu pieniedzy

Tak więc, jeśli wolisz kurs budżetowy, najlepiej będzie, jeśli zaczniesz.

Sztuczna inteligencja Google

Czy jesteś zainteresowany nauką uczenia maszynowego od ekspertów ML z Google?

Cóż, to musisz sprawdzić kursy na Sztuczna inteligencja Google.

Ta platforma oferuje kursy i treści dotyczące uczenia maszynowego i nauki o danych dla studentów, inżynierów oprogramowania, naukowców zajmujących się danymi, a nawet badaczy. Kursy te są bezpłatne.

Zacząć z, Kurs awaryjny uczenia maszynowego w Google AI powinno być Twoim głównym kursem. Jest to szybki kurs z praktycznym wprowadzeniem przy użyciu interfejsów API TensorFlow. Poniżej znajdują się szczegóły tego kursu:

Ta platforma zawiera również specjalne kursy na ważne tematy związane z uczeniem maszynowym, takie jak grupowanie, systemy rekomendacji, testowanie i debugowanie w uczeniu maszynowym, separacja danych i inżynieria funkcji w uczeniu maszynowym. Jeśli znasz już podstawy uczenia maszynowego, te kursy będą wartością dodaną.

Udacity

Udacity to również bardzo popularna platforma e-learningowa, która oferuje mnóstwo kursów dotyczących popularnych technologii. Posiada kilka wiodących w branży programów zbudowanych i uznanych przez czołowe firmy na całym świecie, takie jak AT&T, AWS, Google, IBM.

Jeden z programów w Udacity dotyczy Data Science – Szkoła Nauki o Danych. Ten program pomaga w tworzeniu zadań analityka danych, naukowca danych, inżyniera danych i analityka biznesowego. Kurs na temat Data Scientist w tym programie jest kluczowym, który obejmuje koncepcje dotyczące uczenia maszynowego, głębokiego uczenia się i inżynierii oprogramowania. Aby wybrać ten kurs, musisz mieć podstawową wiedzę na temat uczenia maszynowego.

Jeśli znasz programowanie w Pythonie, ale jesteś nowy w uczeniu maszynowym, na Udacity jest inny program – Szkoła AI. Ten program obejmuje kursy zaczynające się od podstaw uczenia maszynowego.

Głęboka nauka

Ten kurs to błogosławieństwo i moja ulubiona rekomendacja na tej liście, jeśli jesteś programistą.

Powiedziałbym to jeszcze raz: jeśli jesteś programistą.

To dlatego, że ten kurs nie poświęca czasu na naukę podstaw programowania. Opis kursu mówi o tym w bardzo jasny sposób (podkreślenia są oryginalne):

Zakładamy, że każdy uczestnik tego kursu ma co najmniej roczne doświadczenie w kodowaniu. Kurs używa Pythona jako języka nauczania, więc jeśli jeszcze go nie znasz, zakładamy, że spędzisz czas na nauce – dla doświadczonego programisty powinieneś zauważyć, że Python jest dość łatwym językiem do nauczenia.

Więc jeśli znasz już Pythona (jeśli nie dowiedz się tutaj) lub szybko poczujesz się komfortowo, jest to idealny kurs dla pragmatyków, którzy chcą budować prawdziwe, użyteczne systemy, nie przejmując się zbytnio teoretycznymi podstawami algorytmów.

Mógłbym nawet powiedzieć, że to dla niecierpliwych majsterkowiczów (takich jak ja!), którzy nienawidzą ceremonii i monotonii.

I och, czy wspomniałem, że jest w 100% darmowy i ma świetną społeczność?!

Wniosek

Uff!

To była jedna trudna lista do skompilowania. Nie dlatego, że nie było wystarczająco dobrych źródeł, ale dlatego, że było ich zbyt wiele!

Uczenie maszynowe to dziedzina, która dosłownie eksplodowała i naprawdę elegancko rozwiązuje trudne problemy, dlatego istnieją setki kursów online, darmowych i płatnych, z których większość jest naprawdę, naprawdę dobra. Ale może to być również źródłem zamieszania, dlatego próbowałem sprowadzić je do jedenastu dla różnych typów uczniów w zależności od ich poziomu doświadczenia.

Mam nadzieję, że to pomogło!