Python для сложных задач Год издания: 2024 Автор: Вандер Плас Дж. Издательство: Спринт Бук ISBN: 978-601-08-3564-1 Серия: Бестселлеры O’Reilly Язык: Русский Формат: PDF Качество: Издательский макет или текст (eBook) Интерактивное оглавление: Да Количество страниц: 592 Описание: Python — первоклассный инструмент, и в первую очередь благодаря наличию множества библиотек для хранения, анализа и обработки данных. Отдельные части стека Python описываются во многих источниках, но только в новом издании «Python для сложных задач» вы найдете подробное описание: IPython, NumPy, pandas, Matplotlib, Scikit-Learn и др. Специалисты по обработке данных, знакомые с языком Python, найдут во втором издании решения таких повседневных задач, как обработка, преобразование и подготовка данных, визуализация различных типов данных, использование данных для построения статистических моделей и моделей машинного обучения. Проще говоря, эта книга является идеальным справочником по научным вычислениям в Python.
Примеры страниц (скриншоты)
Оглавление
Предисловие 19
ЧАСТЬ I. JUPYTER: ЗА ПРЕДЕЛАМИ ОБЫЧНОГО PYTHON
Глава 1. Знакомство с IPython и Jupyter 27
Глава 2. Расширенные интерактивные возможности 38
Глава 3. Отладка и профилирование 48
ЧАСТЬ II. ВВЕДЕНИЕ В NUMPY
Глава 4. Типы данных в Python 64
Глава 5. Введение в массивы NumPy 72
Глава 6. Вычисления с массивами NumPy: универсальные функции 81
Глава 7. Агрегирование: минимум, максимум и все, что посередине 91
Глава 8. Операции над массивами. Транслирование 97
Глава 9. Сравнения, маски и булева логика 104
Глава 10. «Прихотливая» индексация 114
Глава 11. Сортировка массивов 123
Глава 12. Структурированные данные: структурированные массивы NumPy 130ЧАСТЬ III. МАНИПУЛЯЦИИ НАД ДАННЫМИ
С ПОМОЩЬЮ ПАКЕТА PANDAS
Глава 13. Знакомство с объектами библиотеки Pandas 138
Глава 14. Индексация и выборка данных 147
Глава 15. Операции над данными в библиотеке Pandas 155
Глава 16. Обработка отсутствующих данных 161
Глава 17. Иерархическая индексация 171
Глава 18. Объединение наборов данных: конкатенация и добавление в конец 185
Глава 19. Объединение наборов данных: слияние и соединение 191
Глава 20. Агрегирование и группировка 205
Глава 21. Сводные таблицы 218
Глава 22. Векторизованные операции над строками 227
Глава 23. Работа с временными рядами 237
Глава 24. Увеличение производительности библиотеки Pandas: eval() и query() 259
ЧАСТЬ IV. ВИЗУАЛИЗАЦИЯ
С ПОМОЩЬЮ БИБЛИОТЕКИ MATPLOTLIB
Глава 25. Общие советы по библиотеке Matplotlib 269
Глава 26. Простые линейные графики 276
Глава 27. Простые диаграммы рассеяния 287
Глава 28. Графики плотности и контурные графики 297
Глава 29. Настройка легенд на графиках 308
Глава 30. Настройка цветовых шкал 315
Глава 31. Множественные субграфики 324
Глава 32. Текст и поясняющие надписи 332
Глава 33. Настройка делений на осях координат 340
Глава 34. Настройка Matplotlib: конфигурации и таблицы стилей 349
Глава 35. Построение трехмерных графиков в библиотеке Matplotlib 358
Глава 36. Визуализация с помощью библиотеки Seaborn 368
ЧАСТЬ V. МАШИННОЕ ОБУЧЕНИЕ
Глава 37. Что такое машинное обучение 389
Глава 38. Знакомство с библиотекой Scikit-Learn 401
Глава 39. Гиперпараметры и проверка модели 419
Глава 40. Проектирование признаков 437
Глава 41. Заглянем глубже: наивная байесовская классификация 445
Глава 42. Заглянем глубже: линейная регрессия 455
Глава 43. Заглянем глубже: метод опорных векторов 472
Глава 44. Заглянем глубже: деревья решений и случайные леса 489
Глава 45. Заглянем глубже: метод главных компонент 501
Глава 46. Заглянем глубже: обучение на базе многообразий 515
Глава 47. Заглянем глубже: кластеризация методом k средних 534
Глава 48. Заглянем глубже: смеси гауссовых распределений 549
Глава 49. Заглянем глубже: ядерная оценка плотности распределения 565
Глава 50. Прикладная задача: конвейер распознавания лиц 578
Об авторе 589
Иллюстрация на обложке 590