Poznajemy Sparka Błyskawiczna analiza danych
Menu
Ilość danych we wszystkich domenach wciąż rośnie. Jak możemy skutecznie je wykorzystywać? W książce Poznajemy Sparka przedstawiono Apache Spark, system open source do przetwarzania klastrów, dzięki któremu pisanie i uruchamianie aplikacji analizy danych jest szybsze. Za pomocą Sparka można stawić czoła dużym zbiorom danych za pośrednictwem prostych interfejsów w językach Python, Java i Scala.
Dzięki tej pracy, napisanej przez deweloperów Sparka, naukowcy zajmujący się danymi i inżynierowie dowiedzą się, jak przedstawiać równoległe zadania za pomocą kilku wierszy kodu oraz jak pisać aplikacje od prostych zdań wsadowych do przetwarzania strumieniowego i systemów uczących się. Informacje zawarte w książce pozwolą im na:.
· szybkie zgłębienie możliwości Sparka, takich jak rozproszone zbiory danych, buforowanie w pamięci oraz interaktywna powłoka
· wykorzystywanie wbudowanych bibliotek, łącznie z Spark SQL, Spark Streaming oraz MLlib
· wykorzystywanie paradygmatu programowania zamiast łączenia i dopasowywania narzędzi takich jak Hive, Hadoop, Mahout i Storm
· poznawanie sposobu wykorzystywania aplikacji interakcyjnych, wsadowych i strumieniowych
dołączanie źródeł danych, np. HDFS, Hive, JSON i S3
Dzięki tej pracy, napisanej przez deweloperów Sparka, naukowcy zajmujący się danymi i inżynierowie dowiedzą się, jak przedstawiać równoległe zadania za pomocą kilku wierszy kodu oraz jak pisać aplikacje od prostych zdań wsadowych do przetwarzania strumieniowego i systemów uczących się. Informacje zawarte w książce pozwolą im na:.
· szybkie zgłębienie możliwości Sparka, takich jak rozproszone zbiory danych, buforowanie w pamięci oraz interaktywna powłoka
· wykorzystywanie wbudowanych bibliotek, łącznie z Spark SQL, Spark Streaming oraz MLlib
· wykorzystywanie paradygmatu programowania zamiast łączenia i dopasowywania narzędzi takich jak Hive, Hadoop, Mahout i Storm
· poznawanie sposobu wykorzystywania aplikacji interakcyjnych, wsadowych i strumieniowych
dołączanie źródeł danych, np. HDFS, Hive, JSON i S3
Dane szczegółowe
Autorzy: | Holden Karau, Konwinski Andy, Wendel Patrick, Zaharia Matei |
Wydanie: | 1 |
Języki: | polski |
Tłumaczenie: | Sikorski Witold, Dąbkowska-Kowalik Małgorzata |
Oprawa: | Miękka |
Liczba stron: | 260 |
Rok wydania: | 2021 |
Wydawnictwo: | Wydawnictwo Naukowe PWN |
ISBN: | 9788301184674 |
Język oryginału: | angielski |
Tytuł oryginału: | Learning spark |
Ilość stron: | 260 |