Игры
 Видео
 Музыка
 Графика
 Интересно
 Программы
 Библиотека
 Видеоуроки
 Кулинария
 Разное




zyzy
Добавил новостей Статьи: 9536
Написал комментариев Мысли: 0
ivashka
Добавил новостей Статьи: 8813
Написал комментариев Мысли: 0
didl3
Добавил новостей Статьи: 8431
Написал комментариев Мысли: 0
Kioka83
Добавил новостей Статьи: 5332
Написал комментариев Мысли: 0
trigall
Добавил новостей Статьи: 4668
Написал комментариев Мысли: 0
colt
Добавил новостей Статьи: 4225
Написал комментариев Мысли: 0
NIKIG
Добавил новостей Статьи: 2398
Написал комментариев Мысли: 0
Оцените наш сайт
Всего ответов: 17
Главная » 2023 » Ноябрь » 18 » BigData Team. Практический курс по Big Data. Часть 1,2,3 (2023) PCRec
10:58
BigData Team. Практический курс по Big Data. Часть 1,2,3 (2023) PCRec
Самый быстрый способ прокачать свои навыки для IT-специалистов. Научитесь эффективно обрабатывать большие данные, выполняя практические задания на реальном кластере.

Кому подойдет этот курс:

Разработчикам
Вы программируете, но хотите расширить профессиональные возможности и получить практические навыки работы с большими данными? На курсе вы научитесь работать с Hadoop, MapReduce, Hive, Spark, Kafka, Cassandra и будете выполнять задания на реальном кластере.

Data Engineers
Хотите расширить свой арсенал для работы с данными и структурировать свои знания в DE? Вы узнаете о современных технологиях работы с Big Data, научитесь грамотно их использовать и понимать, какую технологию в каких случаях лучше применять.

Аналитикам
Хотите освоить работу с большими данными, чтобы решать более сложные и интересные аналитические задачи? Вы научитесь использовать инструменты работы с большими данными, проводить аналитику с помощью SQL и NoSQL инструментов, готовить данные и отчеты на основе больших массивов информации. Для тех, кто хочет перейти в сферу Data Science и освоить машинное обучение, рекомендуем пройти "Практический курс Machine Learning."

Data Scientists
Ловите себя на мысли, что качество модели во многом зависит от правильного сбора и предобработки данных? Вы получите базу по современным инструментам и подходам, необходимым для сбора, хранения и обработки данных; изучите особенности укладки данных для оптимизации вычислений, подготовки фичей и масштабирования ML-моделей.

ЧАСТЬ 1 - HDFS
В этом модуле вы изучите:
 вводная часть: знакомство (задачи, оценки, дедлайны), подробности курса;
 распределенные файловые системы (GFS, HDFS). Их составляющие, достоинства, недостатки и сфера применения;
 чтение и запись в HDFS. HDFS APIs: Web, shell.
 Hadoop Streaming;
 элементы Hadoop-задачи (Mapper, reducer, combiner, partitioner, comparator).
 приложения с несколькими Hadoop-задачами;
 тюнинг Hadoop-job (настройка партиционирования, сложные ключи, uber jobs);
 задачи с несколькими входами. Joins в Hadoop.
 архитектура Hive, виды таблиц, форматы хранения данных;
 трансляция Hive-запросов в MapReduce-задачи;
 сериализация и десериализация;
 тюнинг Join'ов в Hive;
 партиционирование, бакетирование, семплирование;
 User defined functions, Hive Streaming.

Часть 2. Spark: from zero to hero
В этом модуле вы изучите:
 cхема выполнения задачи в Spark;
 основные термины Spark (job, task, stage);
 представление вычислений в виде графа. Spark Python API. Spark RDD API;
 Broadcast-сообщения и счетчики.
 взаимодействие Hive и Spark SQL;
 отличия DF от RDD.
 Spark on YARN;
 типы stage в Spark;
 оптимизация операции shuffle;
 настройка Garbage Collection, тюнинг потребления памяти.

ЧАСТЬ 3 - Kafka, RT, NoSQL, Data layout
В этом модуле вы изучите:
 подходы к Realtime-обработке;
 гарантии обработки, переход от одной гарантии к другой, архитектуры "Лямбда" и "Каппа";
 Spark Streaming vs. Spark RDD, Spark Structured Streaming vs. Spark DataFrames, DStream;
 архитектура Kafka, Kafka Streams, репликация в Kafka. Отличие Kafka от классических очередей;
 семантики доставки сообщений, сжатие данных в Kafka, синхронная и асинхронная репликация.
 отличия Key-Value хранилищ от реляционных БД;
 компактификация и её виды, CQLSH;
 архитектура Cassandra;
 обеспечение надёжности и высокодоступности в Key-Value хранилищах;
 интеграция Spark с Cassandra.
 как бороться с Data Skew с помощью MapReduce подходов в разных фреймворках;
 trade-off между CPU и IO-bound приложениями, подходы к сжатию в Big Data, горячие и холодные данные;
 форматы данных в Big Data: ORC vs Parquet, Avro, ..

Информация о видео
Название: Практический курс по Big Data. Часть 1,2,3
Автор: Драль, Артём Выборнов, Павел Клеменков
Год выхода: 2023
Жанр: Видеокурс
Язык: Русский
Выпущено: Россия
Продолжительность: 10:30:55

Файл
Формат: MP4 (+доп.файлы)
Видео: AVC, 1280x720, ~196 Kbps
Аудио: AAC, 128 Kbps, 48.0 KHz
Размер файла: 1.74 Gb


Скачать BigData Team. Практический курс по Big Data. Часть 1,2,3 (2023) PCRec

Раздел: видеоуроки | Автор: colt | Просмотров: 31 | Рейтинг: 0.0/0
Похожие новости:
Всего комментариев: 0
Добавлять комментарии могут только зарегистрированные пользователи.
[ Регистрация | Вход ]
Design powered by Xemera™ Copyright © 2009-2024


Гость


Имя: Гость
IP: 3.129.249.141
Ты здесь: -й день
Добавить новость
Читать ЛС ()
Мой профиль
Выход

Онлайн всего: 2
Гостей: 2
Пользователей: 0

   Всего: 176
   Админ: 1
   Модераторы: 0
   Журналисты: 12
   Проверенные: 5
   Пользователи: 158
   Парней: 142
   Девушек: 34
«  Ноябрь 2023  »
ПнВтСрЧтПтСбВс
  12345
6789101112
13141516171819
20212223242526
27282930
Бесплатный хостинг uCoz
Xemera.At.Ua - информационный портал! Все ссылки на файлы, указанные на сайте взяты из открытых источников интернета и предоставлены пользователями нашего сайта исключительно в ознакомительных целях.
Если вы являетесь правообладателем какого либо материала и не желаете его свободного распространения, или считаете, что какой-либо из материалов нарушает Ваши авторские права - свяжитесь с Администрацией.
Владельцы и создатели данного сайта не несут ответственность за использование и содержание ссылок и информации, представленных на этом сайте.
Сайт оптимизирован для просмотра с разрешением 1024x768, 1280x800, 1280x1024 и 1600x1200 браузером FireFox или Opera