Amazon Sagemaker是什么,怎么用?

Amazon Sagemaker是什么,怎么用?

IDC表示,到2022年,人工智能市场的年复合增长率能达到37%。因为人工智能的普及,市场上出现了一些工具和软件,让AI更容易让市场接受。但综合各方面能力,有一个工具特别突出,就是Amazon Sagemaker。

大数据应用数据应用学院被评为2016北美Top Data Camp, 是最专业一站式数据科学咨询服务机构,你的数据科学求职咨询专家!3748篇原创内容公众号

在这篇文章,我们将深入了解什么是Amazon Sagemaker,为什么使用它,以及如何使用它。如果你想了解更多数据分析相关内容,可以阅读以下这些文章:
使用Amazon SageMaker和AWS Lambda进行无服务器管道自动化模型训练和部署
Amazon Sagemaker是什么,怎么用?
Machine Learning知识点:机器学习里的聚类分析技巧
研究了2000+笔记本,我们总结了最适合机器学习、数据科学和深度学习的电脑

什么是Amazon Sagemaker?

Amazon SageMaker是一项完全托管的服务,可以帮助数据科学家和开发人员快速地构建、训练和部署机器学习(ML)模型。它采用机器学习(ML)的集成开发环境Amazon SageMaker Studio的形式,同时作为了构建其他AWS SageMaker工具集合的基础。

你可以从头构建、训练ML模型,或者购买适合你项目需求的预构建算法。类似的工具还可以用于调试模型、或在模型预测之上添加手动审查过程。

图源:Amazon

为什么要用Amazon Sagemaker?

随着企业规模的扩大,机器学习项目也会变得更加复杂。这是因为,机器学习项目包括三个关键阶段——构建、训练和部署。而随着项目进展,每个阶段之间都可以不断地相互循环,处理的数据量增加,复杂性也会随之增加。如果你想要建立一个真正有效的ML模型,那你就需要更大的训练数据集。

通常,不同阶段的机器学习项目需要不同的技能组合。数据科学家负责研究和制定机器学习模型,而开发人员采用模型,并把他们转换为有用的、可扩展的产品或Web服务API。但是,并不是每个企业都能组建这样一支技术娴熟的团队,也不是每个企业都能实现数据科学家和开发人员之间的协调、或是大规模推出有效的ML模型。

这正是Amazon Sagemaker着手的地方。作为一个完全托管的机器学习平台,SageMaker把软件技能抽象化,能让数据工程师通过一组直观并且易于使用的工具,就能构建、训练他们想要的机器学习模型。虽然,他们发挥了处理数据和制作 ML 模型的核心优势,但要把这些开发成可立即使用的Web服务API所需的繁重工作,还是需要Amazon Sagemaker来处理。

Amazon SageMaker把用于机器学习的所有组件打包在一个shell中,让数据科学家能够用更少工作量和更低成本去交付端到端的ML项目。

它是怎么运行的?

借助构建-训练-部署的3步模型,Amazon SageMaker可以简化你的机器学习模型。接下来,让我们快速浏览一遍它是如何工作的。

  • 构建

Amazon SageMaker提供了一个完全集成的机器学习开发环境,能有效提高你的生产力。你可以在一键式Jupyter notebooks帮助下,以闪电般的速度进行构建和协作。Sagemaker还为这些notebooks提供了一键式共享工具。整个编程的结构都会被自动捕获,让你可以毫无障碍地与其他人协同工作。

除此之外,Amazon SageMaker Autopilot是该行业第一个自动化机器学习的功能集。通过它,你可以完全控制、可视化各自的机器学习模型。传统的自动化机器学习,是不允许查看用于创建该模型的数据或逻辑的。但是,Amazon Sagemaker Autopilot能够与Sagemaker Studio 集成,让你完全了解创作中使用到的原始数据和信息。

亚马逊SageMaker的亮点之一,是它的Ground Truth功能,可以帮你无障碍地建立、管理精确的训练数据集。通过Amazon Mechanical Trunk,Ground Truth还可以提供给你完整的标签访问权限、预先构建的工作流、以及常见的任务接口。Amazon Sagemaker支持多种深度学习框架,包括PyTorch、TensorFlow、Apache MXNet、Chainer、Gluon、Keras、Scikit-learn和deep – graph库。

  • 训练

使用Amazon SageMaker Experiment,你可以轻松地组织、跟踪及评估机器学习模型的每次迭代。训练机器学习模型会包含各种迭代,用来测量、隔离那些因为更改算版本、更改模型参数和数据集所带来的影响。Sagemaker Experiments通过自动抓取配置、参数和结果,并把它们存储为“实验”,来帮助你管理这些迭代。

SageMaker带有Debugger能,能够分析、调试和修复机器学习模型中的所有问题。调试器通过捕获整个过程中的实时指标,让训练过程完全透明。如果在训练过程中检测到任何常见问题,Sagemaker Debugger 还会提供警告和补救建议。

除此之外,AWS Tensorflow optimization通过其庞大的256 GPU,可以提高最多90%的扩展性。这样,在很短的时间内,你就可以体验到精确、复杂的训练模型。而且,Amazon Sagemaker附带的Managed Spot Training,还可以降低培训成本的90%。

  • 部署

Amazon SageMaker给你提供的一键式部署工具,可以让你轻松生成批量或实时数据的预测。让你可以轻松地把模型部署到跨各区域的的Amazon机器学习实例上,进一步改进冗余部分。而你只需要指定所需的最大、最小值,以及实例的类型,剩下的就留给Amazon Sagemaker完成。

影响整体操作准确性的主要问题,可能是用于生成预测的数据和用于训练模型的数据之间的差异。Sagemaker模型监视器会自动检测所有部署模型中的概念漂移,然后提供警报,确定问题的主要来源。

亚马逊Sagemaker还内置了Augmented AI设备,在它的帮助下,如果模型无法做出高度可信的精确预测,你可以很轻松地邀请人工介入。而且,Amazon Elastic Inference还能让机器学习的推理成本降低75%。最后,Amazon还允许你完成Sagemaker与Kubernetes的集成,通过这种集成,你可以轻松实现应用程序部署、扩展和管理的自动化。

感谢你的阅读!你还可以订阅我们的YouTube频道,观看大量数据科学相关公开课:https://www.youtube.com/channel/UCa8NLpvi70mHVsW4J_x9OeQ;在LinkedIn上关注我们,扩展你的人际网络!https://www.linkedin.com/company/dataapplab/

原文作者:Gaurav Mishra
翻译作者:Lea
美工编辑:过儿
校对审稿:Jiawei Tong
原文链接:https://www.srijan.net/resources/blog/amazon-sagemaker