●TensorFlow官方推荐
●机器学习榜首书作者Aurelien Geron作序
●覆盖自动化机器学习的全生命周期
◎ 编辑推荐
正如自动化流水线给汽车制造业带来了质的改变,自动化机器学习流水线也能从根本上加速机器学习领域的发展。机器学习流水线实现了复用、管理和部署机器学习模型的标准化流程。数据科学家和机器学习工程师不仅能摆脱逐个手动构建和训练模型的“作坊式”工作流程,还能产出更可靠、更安全的模型。
本书带领你使用TensorFlow生态圈中的众多工具构建可复现的机器学习流水线,从而将模型部署时间从数天缩短为数分钟,有效地实现机器学习项目产品化。你将学习如下内容。
●了解机器学习流水线的构建步骤
●使用TensorFlow Extended(TFX)构建机器学习流水线
●使用Beam、Airflow、Kubeflow Pipelines编排流水线
●数据校验和数据预处理
●使用TensorFlow的模型分析工具
●检查模型的公平性
●使用TensorFlow Serving和TensorFlow Lite部署模型
●了解差分隐私、联邦学习和加密机器学习等隐私保护方法
◎ 内容简介
本书介绍如何构建完整的机器学习流水线,从而在生产环境中准备数据以及训练、验证、部署和管理机器学习模型。你将了解机器学习流水线的每个环节,以及如何利用TensorFlow Extended(TFX)构建机器学习流水线。模型的生命周期是一个闭环,其中包括数据读取、数据校验、数据预处理、模型训练、模型分析、模型验证、模型部署、模型反馈等环节。你将学习如何利用Beam、Airflow、Kubeflow、TensorFlow Serving等工具将每一个环节的工作自动化。学完本书,你将不再止步于训练单个模型,而是能够从更高的角度将模型产品化,从而为公司创造更大的价值。
汉内斯·哈普克(Hannes Hapke)
数据科学家,善于解决各行各业的机器学习问题,与他人合著有《自然语言处理实战》。
凯瑟琳·纳尔逊(Catherine Nelson)
数据科学家,牛津大学硕士,长期为企业提供机器学习解决方案。