Предварительная подготовка данных в Python: Том 1. Инструменты и валидация [Артём Владимирович Груздев] (pdf) читать постранично

-  Предварительная подготовка данных в Python: Том 1. Инструменты и валидация  80.04 Мб, 818с. скачать: (pdf) - (pdf+fbd)  читать: (полностью) - (постранично) - Артём Владимирович Груздев

Книга в формате pdf! Изображения и текст могут не отображаться!


 [Настройки текста]  [Cбросить фильтры]

А. В. Груздев

Предварительная
подготовка данных
в Python
Том 1
Инструменты и валидация

Москва, 2023

УДК 004.04Python
ББК 32.372
Г90

Г90

Груздев А. В.
Предварительная подготовка данных в Python: Том 1. Инструменты
и валидация. – М.: ДМК Пресс, 2023. – 816 с.: ил.
ISBN 978-5-93700-156-6
В двухтомнике представлены материалы по применению классических методов машинного обучения в различных промышленных задачах. Первый том
посвящен инструментам Python – основным библиотекам, классам и функциям,
необходимым для предварительной подготовки данных, построения моделей
машинного обучения, выполнения различных стратегий валидации. В конце
первого тома разбираются задачи с собеседований по SQL, Python, математической статистике и теории вероятностей.
Издание рассчитано на специалистов по анализу данных, а также может быть
полезно широкому кругу специалистов, интересующихся машинным обучением.

УДК 004.04Python
ББК 32.372

Все права защищены. Любая часть этой книги не может быть воспроизведена в какой
бы то ни было форме и какими бы то ни было средствами без письменного разрешения
владельцев авторских прав.
Материал, изложенный в данной книге, многократно проверен. Но, поскольку вероятность технических ошибок все равно существует, издательство не может гарантировать
абсолютную точность и правильность приводимых сведений. В связи с этим издательство
не несет ответственности за возможные ошибки, связанные с использованием книги.

ISBN 978-5-93700-156-6

© Груздев А. В., 2023
© Оформление, издание, перевод, ДМК Пресс, 2023

Моей Матильде, прошедшей
путь бескорыстной любви
длиной в 22 года, посвящается

Оглавление

Введение............................................................................................. 10
ЧАСТЬ 1. НЕМНОГО МАТЕМАТИКИ.......................................... 11
1.1. Функция.......................................................................................................11
1.2. Производная................................................................................................12
1.3. Дифференцирование сложных функций..................................................15
1.4. Частная производная..................................................................................16
1.5. Градиент......................................................................................................17
1.6. Функция потерь и градиентный спуск......................................................18

Часть 2. Инструменты........................................................................ 23
1. Введение......................................................................................... 23
1.1. Структуры данных......................................................................................23
1.1.1. Кортеж (tuple).......................................................................................23
1.1.2. Список (list)..........................................................................................24
1.1.3. Словарь (dictionary)..............................................................................27
1.1.4. Множество (set)....................................................................................31
1.2. Функция.......................................................................................................34
1.3. Полезные встроенные функции.................................................................35
1.3.1. Функция enumerate()...........................................................................35
1.3.2. Функция sorted()..................................................................................36
1.3.3. Функция zip()........................................................................................36
1.4. Класс.............................................................................................................38
1.5. Знакомство с Anaconda...............................................................................43

2. IPython и Jupyter Notebook........................................................... 44
3. NumPy.............................................................................................. 50
3.1. Создание массивов NumPy.........................................................................50
3.2. Обращение к элементам массива..............................................................55
3.3. Получение краткой информации о массиве.............................................57
3.4. Изменение формы массива........................................................................58
3.5. Конкатенация массивов.............................................................................61
3.6. Функции математических операций, знакомство
с правилами транслирования...........................................................................65
3.7. Обработка пропусков..................................................................................70
3.8. Функция np.linspace().................................................................................72
3.9. Функция np.logspace().................................................................................74

Оглавление  5
3.10. Функция np.digitize()................................................................................75
3.11. Функция np.searchsorted()........................................................................76
3.12. Функция np.bincount()..............................................................................78
3.13. Функция np.apply_along_axis()..................................................................79
3.14. Функция np.insert()...................................................................................80
3.15. Функция np.repeat()..................................................................................81
3.16. Функция np.unique().................................................................................82
3.17. Функция np.take_along_axis()....................................................................84
3.18. Функция np.array_split()............................................................................86

4. Библиотеки Numba, datatable, bottleneck
для ускорения вычислений.............................................................. 88
4.1. Numba..........................................................................................................88
4.2. Datatable......................................................................................................94
4.3. Bottleneck.....................................................................................................98

5. SciPy................................................................................................. 99
6.