Python for Data Analysis
Data Wrangling with Pandas, NumPy,
and IPython
Wes McKinney
Beijing • Boston • Farnham • Sebastopol • Tokyo
ВТОРОЕ ИЗДАНИЕ
Python и анализ данных
Первичная обработка данных
с применением pandas, NumPy и IPython
Уэс Маккини
Москва, 2020
УДК 004.438Python:004.6
ББК 32.973.22
М15
Маккини У.
М15 Python и анализ данных / пер. с анг. А. А. Слинкина. – М.: ДМК Пресс,
2020. – 540 с.: ил.
ISBN 978-5-94074-590-5
Второе издание этой книги дает современное практическое введение в разработку научных приложений на Python, ориентированных на обработку данных.
Код переписан под версию Python 3.6, добавлены сведения о последних версиях
библиотек pandas, NumPy, IPython и Jupyter.
Описаны те части языка Python и библиотеки для него, которые необходимы
для эффективного решения широкого круга аналитических задач: интерактивная оболочка IPython и Jupyter-блокноты, библиотеки NumPy и pandas, библиотека для визуализации данных matplotlib и др.
Издание подойдет как аналитикам, только начинающим осваивать обработку
данных, так и опытным программистам на Python, еще не знакомым с научными
приложениями.
Предисловие ........................................................................................................................................................14
Об авторе ................................................................................................................................................................20
Об иллюстрации на обложке .................................................................................................................21
Глава 1. Предварительные сведения ..............................................................................................22
1.1.
1.2.
1.3.
1.4.
О чем эта книга? ......................................................................................................................................22
Какого рода данные?............................................................................................................................22
Почему именно Python?......................................................................................................................23
Python как клей ........................................................................................................................................23
Решение проблемы «двух языков»..............................................................................................24
Недостатки Python .................................................................................................................................24
Необходимые библиотеки для Python ......................................................................................25
NumPy ............................................................................................................................................................25
pandas.............................................................................................................................................................26
matplotlib .....................................................................................................................................................27
IPython и Jupyter ......................................................................................................................................27
SciPy ................................................................................................................................................................28
scikit-learn....................................................................................................................................................28
statsmodels..................................................................................................................................................29
Установка
30
Windows ........................................................................................................................................................30
Apple OS X ...................................................................................................................................................30
GNU/Linux ....................................................................................................................................................31
Установка или
...........................................................................31
6
1.5.
1.6.
Содержание
Python 2 и Python 3 ...............................................................................................................................32
Интегрированные среды разработки (IDE) .............................................................................32
Сообщество и конференции ............................................................................................................33
Структура книги ........................................................................................................................................34
Примеры кода ...........................................................................................................................................34
Данные для примеров .........................................................................................................................35
Соглашения об импорте ......................................................................................................................35
Жаргон ...........................................................................................................................................................35
Глава 2. Основы языка Python, IPython и Jupyter-блокноты .......................................36
2.1.
2.2.
2.3.
Интерпретатор Python .........................................................................................................................37
Основы IPython ........................................................................................................................................38
Запуск оболочки IPython....................................................................................................................38
Запуск Jupyter-блокнота .....................................................................................................................39
Завершение по нажатии клавиши Tab
Последние комментарии
3 минут 17 секунд назад
1 час 13 минут назад
1 час 49 минут назад
1 час 50 минут назад
1 час 53 минут назад
18 часов 20 минут назад