生产系统中的机器学习建模管道

在《生产系统中的机器学习工程(MLOps)》专业课程的第三门课程中,您将为不同的服务环境构建模型;实践有效管理建模资源的工具和技术,并为离线和在线推理请求提供最佳服务;使用分析工具和性能指标来解决模型公平性、可解释性问题,并缓解瓶颈。

课程大纲

第一章:神经网络架构搜索

本章节共有9个视频 、4个阅读 、4个练习 ,完成时间184分钟。

9个视频

1. 整体概览 (2分钟)

2. 超参数调整 (3分钟)

3. Keras Autotuner Demo (6分钟)

4. 介绍AutoML (5分钟)

5. 了解搜索空间 (2分钟)

6. 搜索策略 (4分钟)

7. 测量AutoML效率 (3分钟)

8. 云端的AutoML (8分钟)

9. 第一章总结 (1分钟)

4个阅读

1. 神经网络架构搜索 (3分钟)

2. AutoML (3分钟)

3. 欢迎加入DeepLearning.AI中国官方论坛! (1分钟)

4. 第一章课程讲义 (1分钟)

4个练习

1. 超参数调整和神经网络架构搜索 (10分钟)

2. 介绍Keras Tuner (不计分)(60分钟)

3. 超参数调整和使用TFX训练模型 (不计分)(60分钟)

4. AutoML (12分钟)

第二章:模型资源管理技术

本章节共有13个视频 、4个阅读 、5个练习 ,完成时间273分钟。

13个视频

1. 维数对性能的影响 (8分钟)

2. 维数灾难 (9分钟)

3. 维数灾难:举例 (4分钟)

4. 手动降维 (5分钟)

5. 手动降维:案例学习 (7分钟)

6. 算法降维 (2分钟)

7. 主成分分析 (7分钟)

8. 其他技术 (7分钟)

9. 移动端、IoT和其他相似用例 (7分钟)

10. 量化的好处和过程 (8分钟)

11. 训练后量化 (4分钟)

12. 量化意识训练 (4分钟)

13. 修剪 (12分钟)

4个阅读

1. 降维技术 (3分钟)

2. 量化 (3分钟)

3. 修剪 (12分钟)

4. 第二章课程讲义 (1分钟)

5个练习

1. 手动执行特征工程 (不计分)(30分钟)

2. 降维 (20分钟)

3. 算法降维 (不计分)(40分钟)

4. 量化和修剪 (20分钟)

5. 量化和修剪 (不计分)(60分钟)

第三章:高性能建模

本章节共有6个视频 、3个阅读 、4个练习 ,完成时间222分钟。

6个视频

1. 分布式训练 (10分钟)

2. 高性能接入 (11分钟)

3. 机训练大型模型-巨型神经网络和并行性的兴起 (13分钟)

4. 教师和学生网络 (3分钟)

5. 知识蒸馏技术 (9分钟)

6. 案例学习-如何对Q&A任务进行知识蒸馏 (8分钟)

3个阅读

1. 高性能建模 (5分钟)

2. 知识蒸馏 (2分钟)

3. 第三章课程讲义 (1分钟)

4个练习

1. TensorFlow和Keras参与的分布式策略 (不计分)(60分钟)

2. 高性能建模 (20分钟)

3. 知识蒸馏 (不计分)(60分钟)

4. 知识蒸馏 (20分钟)

第三章:模型分析

本章节共有12个视频 、6个阅读 、6个练习 ,完成时间296分钟。

12个视频

1. 模型性能分析 (7分钟)

2. 介绍TensorFlow 模型分析 (6分钟)

3. 实践TFMA (3分钟)

4. 模型调试概览 (3分钟)

5. 基准模型 (1分钟)

6. 敏感性分析和对抗性攻击 (9分钟)

7. 对抗性攻击Demo (4分钟)

8. 残差分析 (2分钟)

9. 模型修复 (4分钟)

10. 公平 (4分钟)

11. 衡量公平 (5分钟)

12. 持续评估和监控 (14分钟)

6个阅读

1. TensorBoard (3分钟)

2. TensorFlow 模型分析 (3分钟)

3. 敏感性分析和对抗性攻击 (3分钟)

4. 模型修复和公平 (5分钟)

5. 持续评估和监控 (5分钟)

6. 第四章课程讲义 (1分钟)

6个练习

1. 模型分析 (8分钟)

2. TensorFlow 模型分析 (不计分)(60分钟)

3. 用TFX Evaluator 进行模型分析 (不计分)(60分钟)

4. 公平性指标工具 (不计分)(60分钟)

5. 模型分析和调试 (18分钟)

6. 持续评估和监控 (8分钟)

第三章:可解释性

本章节共有11个视频 、10个阅读 、5个练习 ,完成时间164分钟。

11个视频

1. 可解释的AI (6分钟)

2. 模型解释方法 (9分钟)

3. 本质的解释方法 (10分钟)

4. 模型不可知方法 (1分钟)

5. PDP-部分依赖情节 (5分钟)

6. 排列特征重要性 (3分钟)

7. Shapley Values (7分钟)

8. SHapley Additive exPlanations (SHAP) (3分钟)

9. 概念激活向量测试 (3分钟)

10. LIME (1分钟)

11. AI解释 (5分钟)

10个阅读

1. 可解释的AI (3分钟)

2. 可解释性 (5分钟)

3. 排列特征重要性 (2分钟)

4. 理解模型预测 (2分钟)

5. TCAV and LIME (2分钟)

6. AI解释 (2分钟)

7. 第五章课程讲义 (1分钟)

8. 第三课选读文献 (1分钟)

9. 鸣谢 (3分钟)

10. 欢迎加入DeepLearning.AI论坛! (10分钟)

5个练习

1. 可解释的AI (6分钟)

2. 可解释性 (6分钟)

3. 排列特征重要性 (不计分)(30分钟)

4. Shapley Values (不计分)(30分钟)

5. 理解模型预测 (8分钟)

讲师介绍

Robert Crowe

TensorFlow开发工程师,Google

简介:Robert Crowe是谷歌TensorFlow的工程师,他热衷于帮助开发人员快速学习提高生产效率所需的知识。从很早的时候起,他就开始使用TensorFlow,并对它的快速发展感到兴奋。在转向数据科学之前,Robert领导了大公司和小公司的软件工程团队,专注于为定义良好的需求提供干净、优雅的解决方案。

Robert Crowe

TensorFlow开发工程师,Google

简介:Robert Crowe是谷歌TensorFlow的工程师,他热衷于帮助开发人员快速学习提高生产效率所需的知识。从很早的时候起,他就开始使用TensorFlow,并对它的快速发展感到兴奋。在转向数据科学之前,Robert领导了大公司和小公司的软件工程团队,专注于为定义良好的需求提供干净、优雅的解决方案。