Пожертвування 15 вересня 2024 – 1 жовтня 2024 Про збір коштів

Python数据科学导论

  • Main
  • Python数据科学导论

Python数据科学导论

(法)戴维·西伦,(法)亚诺D.B.梅斯曼,(法)穆罕默德·阿里著;王艳,刘义,于晨昕等译, 西伦 (Cielen, Davy)
Наскільки Вам сподобалась ця книга?
Яка якість завантаженого файлу?
Скачайте книгу, щоб оцінити її якість
Яка якість скачаних файлів?
1 (p1): 第1章 大数据世界中的数据科学
2 (p1-1): 1.1 数据科学和大数据的好处和用途
3 (p1-2): 1.2 数据种类
3 (p1-2-1): 1.2.1 结构化数据
3 (p1-2-2): 1.2.2 非结构化数据
4 (p1-2-3): 1.2.3 自然语言数据
4 (p1-2-4): 1.2.4 计算机数据
5 (p1-2-5): 1.2.5 图类数据
5 (p1-2-6): 1.2.6 音频、视频和图像数据
6 (p1-2-7): 1.2.7 流数据
6 (p1-3): 1.3 数据科学过程
6 (p1-3-1): 1.3.1 设置研究目标
6 (p1-3-2): 1.3.2 检索数据
7 (p1-3-3): 1.3.3 数据准备
7 (p1-3-4): 1.3.4 数据探索
7 (p1-3-5): 1.3.5 数据建模
7 (p1-3-6): 1.3.6 展示与自动化
7 (p1-4): 1.4 大数据生态系统与数据科学
7 (p1-4-1): 1.4.1 分布式文件系统
9 (p1-4-2): 1.4.2 分布式编程框架
9 (p1-4-3): 1.4.3 数据集成框架
9 (p1-4-4): 1.4.4 机器学习框架
10 (p1-4-5): 1.4.5 NoSQL数据库
10 (p1-4-6): 1.4.6 调度工具
10 (p1-4-7): 1.4.7 基准测试工具
11 (p1-4-8): 1.4.8 系统部署
11 (p1-4-9): 1.4.9 服务开发
11 (p1-4-10): 1.4.10 安全
11 (p1-5): 1.5 Hadoop工作示例介绍
16 (p1-6): 1.6 本章小结
17 (p2): 第2章 数据科学过程
17 (p2-1): 2.1 数据科学过程概述
19 (p2-2): 2.2 步骤1:定义研究目标并创立项目章程
20 (p2-2-1): 2.2.1 了解研究的目标和背景
20 (p2-2-2): 2.2.2 创立项目章程
20 (p2-3): 2.3 步骤2:检索数据
21 (p2-3-1): 2.3.1 从存储在公司内部的数据开始
21 (p2-3-2): 2.3.2 不要害怕去购买数据
22 (p2-3-3): 2.3.3 检查数据质量以预防问题发生
22 (p2-4): 2.4 步骤3:数据的清洗、整合以及转换
22 (p2-4-1): 2.4.1 数据清洗
27 (p2-4-2): 2.4.2 尽可能早地修正错误
28 (p2-4-3): 2.4.3 从不同的数据源整合数据
30 (p2-4-4): 2.4.4 数据转换
32 (p2-5): 2.5 步骤4:探索性数据分析
35 (p2-6): 2.6 步骤5:构建模型
35 (p2-6-1): 2.6.1 模型与变量的选择
36 (p2-6-2): 2.6.2 模型执行
39 (p2-6-3): 2.6.3 模型诊断与模型比较
40 (p2-7): 2.7 步骤6:展示结果并在其上搭建应用程序
40 (p2-8): 2.8 本章小结
42 (p3): 第3章 机器学习
42 (p3-1): 3.1 什么是机器学习,为什么需要关注它
43 (p3-1-1): 3.1.1 机器学习在数据科学中的应用
43 (p3-1-2): 3.1.2 机器学习在数据科学过程中的使用
44 (p3-1-3): 3.1.3 Python工具在机器学习中的应用
45 (p3-2): 3.2 建模过程
46 (p3-2-1): 3.2.1 特征工程以及模型选取
47 (p3-2-2): 3.2.2 模型的训练
47 (p3-2-3): 3.2.3 模型的验证
48 (p3-2-4): 3.2.4 预测新的观测值
48 (p3-3): 3.3 机器学习的类型
48 (p3-3-1): 3.3.1 有监督学习
53 (p3-3-2): 3.3.2 无监督学习
60 (p3-4): 3.4 半监督学习
61 (p3-5): 3.5 本章小结
63 (p4): 第4章 单机上处理大数据
63 (p4-1): 4.1 大数据处理过程中遇到的难题
64 (p4-2): 4.2 处理巨量数据的通用技术
65 (p4-2-1): 4.2.1 选择合适的算法
71 (p4-2-2): 4.2.2 选择合适的数据结构
73 (p4-2-3): 4.2.3 选择合适的工具
75 (p4-3): 4.3 处理大数据集的通用编程技巧
75 (p4-3-1): 4.3.1 不必重复发明轮子
76 (p4-3-2): 4.3.2 充分利用硬件
76 (p4-3-3): 4.3.3 减少计算需求
77 (p4-4): 4.4…
Рік:
2017
Видання:
2017
Видавництво:
北京:机械工业出版社
Мова:
Chinese
ISBN 10:
7111578260
ISBN 13:
9787111578260
Файл:
PDF, 110.60 MB
IPFS:
CID , CID Blake2b
Chinese, 2017
Завантажити (pdf, 110.60 MB)
Виконується конвертація в
Конвертація в не вдалась

Ключові фрази