コンテンツにスキップ

Azure Container for PyTorch (ACPT)

Azure Container for PyTorch(ACPT)は、大規模モデルの最適化されたトレーニングを効果的に実行するために必要なコンポーネントを含む、軽量でスタンドアロンの環境です。準備コストの削減と展開時間の短縮に役立ちます。ACPTを使用すると、Azure上のPyTorchでさまざまなディープラーニングタスクを迅速に開始できます。

  • 柔軟性: プリインストールされたパッケージをそのまま使用するか、キュレーションされた環境の上に構築します。
  • 使いやすさ: すべてのコンポーネントがインストールされ、数十のMicrosoftワークロードに対して検証されているため、セットアップコストが削減され、価値実現までの時間が短縮されます。
  • 効率: 不要なイメージビルドを回避し、イメージ/コンテナ内ですぐにアクセスできる必要な依存関係のみを持つことができます。
  • 最適化されたトレーニングフレームワーク: 大規模なワークロードでPyTorchモデルをセットアップ、開発、高速化し、トレーニングと展開の成功率を向上させます。
  • 最新のスタック: Ubuntu、Python、PyTorch、CUDA/RocMなどの最新の互換バージョンにアクセスできます。
  • 最新のトレーニング最適化テクノロジー: ONNX Runtime、DeepSpeed、MSCCLなどを活用できます。

Azure Container for PyTorch(ACPT)のサポートされている構成

Section titled “Azure Container for PyTorch(ACPT)のサポートされている構成”

Microsoft Container Registry(MCR)では、次の構成がサポートされています:イメージリスト

fairscale、horovod、msccl、protobuf、pyspark、pytest、pytorch-lightning、tensorboard、NebulaML、torchvision、torchmetricsなどの他のパッケージは、すべてのトレーニングニーズをサポートするために提供されています。

参照するベースイメージを含む、サポートされている環境のバージョンアップデートは、30日以内の脆弱性に対処するために2週間ごとにリリースされます。使用状況に基づいて、一部の環境は、より一般的な機械学習シナリオをサポートするために非推奨(製品から非表示にされますが、使用可能)になる場合があります。