概述#

Ray 是一个开源统一框架，用于扩展机器学习等 AI 和 Python 应用程序。它提供了用于并行处理的计算层，因此您不需要成为分布式系统专家。 Ray 使用这些组件最大限度地降低了运行分布式个体和端到端机器学习工作流程的复杂性：

对于数据科学家和机器学习从业者来说，Ray 可以让您在不需要基础设施专业知识的情况下扩展工作：

对于 ML 平台构建者和 ML 工程师，Ray：

对于分布式系统工程师来说，Ray 自动处理关键流程：

你可以用 Ray 做什么#

以下是个人、组织和公司利用 Ray 构建 AI 应用程序的一些常见 ML 工作负载：


Stack of Ray libraries - unified toolkit for ML workloads.

Ray 的统一计算框架由三层组成：

Ray AI 类库–一组开源、Python、特定领域的库，为 ML 工程师、数据科学家和研究人员提供用于 ML 应用程序的可扩展且统一的工具包。
Ray Core–一个开源 Python 通用分布式计算库，使 ML 工程师和 Python 开发人员能够扩展 Python 应用程序并加速机器学习工作负载。
Ray Clusters–连接到公共 Ray 头节点的一组 worker 节点。 Ray 集群可以是固定大小的，也可以根据集群上运行的应用程序请求的资源自动缩放。

扩展机器学习工作负载

使用分布式库工具包构建 ML 应用程序数据处理, 模型训练, 调参, 强化学习, 模型服务, 以及更多。

构建分布式应用

使用如下方案构建并运行分布式应用简单灵活的 API. :doc:很小甚至零改动 并行化 单机代码。

部署大规模工作负载

在 AWS，GCP，Azure 或现场部署工作负载。使用 Ray 集群管理来在已有 Kubernetes 或 YARN 或或 Slurm 集群运行 Ray。

Ray 的五个原生类库都分配一个特定的 ML 任务：

Ray 的库既适合数据科学家，也适合机器学习工程师。对于数据科学家来说，这些库可用于扩展个人工作负载以及端到端的机器学习应用程序。对于机器学习工程师来说，这些库提供了可扩展的平台抽象，可用于轻松加载和集成更广泛的机器学习生态系统中的工具。

对于自定义应用，Ray 核心类库使 Python 开发人员能够轻松构建可在笔记本电脑、集群、云或 Kubernetes 上运行的可扩展的分布式系统。它是 Ray AI 库和第三方集成（Ray 生态系统）的基础。

Ray 可以在任何机器、集群、云提供商和 Kubernetes 上运行，并且具有发展增长的社区整合生态系统。