料金 - Amazon SageMaker

Amazon SageMaker 無料利用枠

Amazon SageMaker は無料でお試しいただけます。AWS 無料利用枠の一環として、Amazon SageMaker の使用を無料で開始できます。無料利用枠は、初めて SageMaker リソースを作成した最初の月から始まります。Amazon SageMaker の無料利用枠の詳細は、以下の表でご確認いただけます。

Amazon SageMaker の機能	最初の 2 か月間は 1 か月あたりの無料利用枠を利用可能
スタジオノートブック、およびノートブックインスタンス	Studio ノートブックで 250 時間の ml.t3.medium インスタンス、またはノートブックインスタンスで 250 時間の ml.t2 medium インスタンスまたは ml.t3.medium インスタンス
RStudio on SageMaker	RSession アプリケーションの ml.t3.medium インスタンスを 250 時間分、および RStudioServerPro アプリケーションの ml.t3.medium インスタンスを無料で提供
Data Wrangler	25 時間の ml.m5.4xlarge インスタンス
特徴量ストア	1,000 万書き込みユニット、1,000 万読み取りユニット、25 GB ストレージ (標準オンラインストア)
トレーニング	50 時間の m4.xlarge または m5.xlarge インスタンス
Amazon SageMaker with TensorBoard	300 時間の ml.r5.large インスタンス
リアルタイム推論	125 時間の m4.xlarge または m5.xlarge インスタンス
サーバーレス推論	150,000 秒のオンデマンド推論時間
キャンバス	セッション時間は160時間/月
HyperPod	50 時間の m5.xlarge インスタンス

AWS 料金計算ツール

Amazon SageMaker とアーキテクチャのコストを一回の見積もりで算出します。

今すぐカスタム見積もりを作成する »

オンデマンド料金

スタジオクラシック
Amazon SageMaker Studio クラシック
Studio Classic は、従来の IDE エクスペリエンスの中でもワンステップの Jupyter notebooks を提供します。基盤となるコンピューティングリソースは完全に伸縮自在であり、ノートブックは他の人と簡単に共有できるため、シームレスなコラボレーションが可能になります。使用期間に基づいて、選択したインスタンスタイプについて課金されます。
JupyterLab
Amazon SageMaker JupyterLab
フルマネージド型 JupyterLab を数秒で起動できます。ノートブック、コード、データ用の最新の Web ベースのインタラクティブ開発環境を使用してください。使用期間に基づいて、選択したインスタンスタイプについて課金されます。
コードエディタ
Amazon SageMaker コードエディター
Code-OSS (Visual Studio Code — オープンソース) をベースにしたコードエディターを使用すると、分析コードや ML コードの記述、テスト、デバッグ、実行を行うことができます。SageMaker Studio と完全に統合されており、Open VSX 拡張レジストリで利用可能な IDE 拡張機能をサポートしています。
RStudio
RStudio
RStudio は、モデル開発を加速し、生産性を向上させるためのオンデマンドクラウドコンピューティングリソースを提供します。 RStudio Session アプリケーションと RStudio Server Pro アプリケーションを実行するために選択したインスタンスタイプに対して課金されます。

RStudioServerPro アプリケーション
ノートブックインスタンス
ノートブックインスタンス
ノートブックインスタンスは、Jupyter Notebook アプリを実行するコンピューティングインスタンスです。使用期間に基づいて、選択したインスタンスタイプについて課金されます。
処理
Amazon SageMaker Processing
Amazon SageMaker Processing を使用すると、フルマネージド型のインフラストラクチャで前処理、後処理、およびモデル評価のワークロードを簡単に実行できます。使用期間に基づいて、選択したインスタンスタイプについて課金されます。
TensorBoard
Amazon SageMaker with TensorBoard
Amazon SageMaker with TensorBoard は、Amazon SageMaker トレーニングジョブのモデルコンバージェンスの問題を視覚化およびデバッグするためのホスト型 TensorBoard エクスペリエンスを提供します。
Data Wrangler
Amazon SageMaker Data Wrangler

Amazon SageMaker Data Wrangler は、機械学習用のデータを集約して準備するのにかかる時間を数週間から数分に短縮します。データのクレンジング、探索、および視覚化に使用した時間について料金をお支払いいただきます。SageMaker Data Wrangler インスタンスを実行しているお客様には、以下の価格が適用されます。* SageMaker Canvas ワークスペースインスタンスで SageMaker Data Wrangler を実行しているお客様には、SageMaker Canvas の料金が適用されます。詳細については、SageMaker Canvas の料金ページをご覧ください。

Amazon SageMaker Data Wrangler ジョブ

Amazon SageMaker Data Wrangler ジョブは、データフローが SageMaker Data Wrangler からエクスポートされるときに作成されます。SageMaker Data Wrangler ジョブを使用すると、データ準備ワークフローを自動化できます。SageMaker Data Wrangler ジョブは、データ準備ワークフローを新しいデータセットに再適用して時間を節約するのに役立ち、秒単位で請求されます。
Feature Store
Amazon SageMaker Feature Store
Amazon SageMaker Feature Store は、機械学習のために特徴量を取り込み、保存し、提供するための一元的なリポジトリです。SageMaker Feature Store への特徴量グループでの書き込み、読み取り、およびデータストレージには料金がかかりますが、標準オンラインストアとインメモリオンラインストアでは料金が異なります。

標準オンラインストアでは、データストレージは 1 か月あたり GB 単位で課金されます。スループットについては、オンデマンドまたはプロビジョニングされたキャパシティーモードを選択できます。オンデマンドの場合、書き込みは KB あたりの書き込みリクエストユニットとして課金され、読み取りは 4 KB あたりの読み取りリクエストユニットとして課金されます。プロビジョニングされたキャパシティーモードでは、アプリケーションに必要と予想される読み込みと書き込みのキャパシティーを指定します。Sagemaker Feature Store では、1 秒あたりの書き込みごとに 1 つの WCU (最大 1 KB)、1 秒あたりの読み取りごとに 1 つの RCU (最大 4 KB) が課金されます。特徴量グループにプロビジョニングされたスループットキャパシティ (読み取りと書き込み) については、プロビジョニングされた容量を完全に利用しなかった場合でも課金されます。

インメモリオンラインストアでは、書き込みは KB ごとに書き込みリクエストユニットとして課金され、書き込み 1 回につき最低 1 ユニット、読み取りは KB ごとに読み取りリクエストユニットとして課金され、読み取り 1 回につき最低 1 ユニット、データストレージは 1 時間あたり GB あたりで課金されます。インメモリオンラインストアには、1 時間あたり 5 GiB (5.37 GB) の最小データストレージ料金がかかります。
トレーニング
Amazon SageMaker トレーニング
Amazon SageMaker は、モデルのトレーニング、調整、およびデバッグに必要なすべてを提供することで、機械学習 (ML) モデルのトレーニングを容易にします。選択したインスタンスタイプの使用料金が請求されます。Amazon SageMaker Debugger を使用してトレーニング中に問題をデバッグし、リソースをモニタリングする場合、組み込みルールを使用してトレーニングジョブをデバッグしたり、独自のカスタムルールを記述したりできます。組み込みルールを使用したトレーニングジョブのデバッグには、追加料金はかかりません。カスタムルールについては、使用期間に基づいて、選択したインスタンスタイプについて課金されます。
MLflow
Amazon SageMaker と MLflow
Amazon SageMaker と MLflow を利用すると、お支払いいただくのは使用した分の料金のみです。お客様には、コンピューティングとストレージのコストに基づいて MLflow トラッキングサーバーの料金をお支払いいただきます。

お客様には、トラッキングサーバーのサイズと実行時間数に基づいてコンピューティング料金をお支払いいただきます。さらに、MLflow トラッキングサーバーに保存されているメタデータの料金もお支払いいただきます。
リアルタイム推論
Amazon SageMaker ホスティング: リアルタイム推論
Amazon SageMaker は、リアルタイムの予測が必要なユースケースにリアルタイムの推論を提供します。選択したインスタンスタイプの使用料金が請求されます。Amazon SageMaker Model Monitor を使用して、リアルタイムの推論を提供する高精度のモデルを維持する場合、組み込みルールを使用してモデルをモニタリングしたり、独自のカスタムルールを記述したりできます。組み込みルールについては、最長 30 時間のモニタリングを無料でご利用いただけます。追加料金は使用期間に基づきます。独自のカスタムルールを使用する場合は、別途料金が発生します。
非同期推論
Amazon SageMaker 非同期推論:
Amazon SageMaker 非同期推論は、受信したリクエストをキューに入れて非同期に処理する、ほぼリアルタイムの推論オプションです。このオプションは、データが到着したときに大規模なペイロードを処理する必要がある場合や、推論処理時間が長く、サブ秒のレイテンシー要件を持たないモデルを実行する場合に使用します。選択したインスタンスの種類に応じて課金されます。
バッチ変換
Amazon SageMaker バッチ変換
Amazon SageMaker バッチ変換を使用すると、データセットを複数のチャンクに分けたりリアルタイムのエンドポイントを管理したりする必要はありません。SageMaker バッチ変換により、大小のバッチデータセットに対する予測を実行できます。使用期間に基づいて、選択したインスタンスタイプについて課金されます。
サーバーレス推論
Amazon SageMaker Serverless Inference
Amazon SageMaker Serverless Inference を使用すると、基盤となるインフラストラクチャを設定または管理することなく、推論用の機械学習モデルをデプロイできます。オンデマンドの Serverless Inference を使用するか、予測可能なパフォーマンスを実現するためにエンドポイントに Provisioned Concurrency を追加することができます。

オンデマンドの Serverless Inference では、推論要求の処理に使用されるコンピューティング性能、ミリ秒単位の請求、および処理されるデータの量に対してのみ料金を支払います。コンピューティング料金は、選択したメモリ設定によって異なります。

Provisioned Concurrency

オプションで、サーバーレスエンドポイントで Provisioned Concurrency を有効にすることもできます。Provisioned Concurrency を使用すると、指定された数の同時リクエストと指定された時間に対してエンドポイントを温存することで、予測可能なパフォーマンスと高いスケーラビリティを備えたサーバーレスエンドポイントにモデルをデプロイすることができます。オンデマンドのサーバーレス推論と同様に、Provisioned Concurrency が有効になっている場合は、推論リクエストの処理に使用されたコンピューティング容量 (ミリ秒単位) と処理されたデータ量に対して料金が発生します。また、設定されたメモリ、プロビジョニングされた期間、有効になっている同時実行の量に基づいて、プロビジョニングされた同時実行の使用量に対しても支払いが発生します。
JumpStart
Amazon SageMaker JumpStart
Amazon SageMaker JumpStart は、人気のモデルコレクション (「モデルズー」とも呼ばれる) にワンクリックでアクセスできるため、機械学習をすばやく簡単に始めることができます。Jumpstart は、一般的な機械学習ユースケースを解決するエンドツーエンドソリューションも提供しており、お客様のニーズに合わせてカスタマイズすることができます。JumpStart のモデルやソリューションの使用には、追加料金はかかりません。基礎となるトレーニングおよび推論インスタンスの使用時間については、手動で作成した場合と同じように課金されます。
Profiler
Amazon SageMaker Profiler は、システムレベルのデータを収集して、高解像度の CPU および GPU トレースプロットを視覚化します。このツールは、データサイエンティストやエンジニアが深層学習モデルにおけるハードウェア関連のパフォーマンスのボトルネックを特定できるように設計されており、エンドツーエンドのトレーニング時間とコストを節約できます。現在、SageMaker Profiler は ml.g4dn.12xlarge、ml.p3dn.24xlarge、および ml.p4d.24xlarge トレーニングコンピュートインスタンスタイプを利用したトレーニングジョブのプロファイリングのみをサポートしています。

地域: 米国東部 (オハイオ)、米国東部 (バージニア北部)、米国西部 (オレゴン)、欧州 (フランクフルト)、欧州 (アイルランド)、イスラエル (テルアビブ)。

Amazon SageMaker Profiler は現在プレビュー段階であり、サポート対象地域のお客様は無料でご利用いただけます。
HyperPod
Amazon SageMaker HyperPod
Amazon SageMaker ハイパーポッドは、基盤モデル (FM) の開発を加速させることを目的として設計されています。FM トレーニングの耐障害性を高めるため、クラスターの状態を継続的に監視し、障害のあるノードをその場で修復および交換し、頻繁なチェックポイントを保存して、進行状況を失うことなく自動的にトレーニングを再開します。SageMaker HyperPod には SageMaker 分散トレーニングライブラリがあらかじめ設定されているため、クラスターのコンピューティングとネットワークインフラストラクチャを最大限に活用しながら FM トレーニングのパフォーマンスを改善できます

注: SageMaker HyperPod の料金には、Amazon EKS、Amazon FSx for Lustre、Amazon Simple Storage Service (Amazon S3) など、HyperPod クラスターに接続されたサービスの料金は含まれていません。
推論の最適化
推論最適化ツールキットを使用すると、最新の推論最適化手法を簡単に実装して、デベロッパーの時間を数か月節約しながら、Amazon SageMaker で最先端 (SOTA) のコストパフォーマンスを実現できます。SageMaker が提供するさまざまな人気の最適化手法から選択して、事前に最適化ジョブを実行し、モデルのパフォーマンスと精度のメトリクスをベンチマーキングしてから、最適化されたモデルを推論のために SageMaker エンドポイントにデプロイできます。

インスタンスの詳細

Amazon SageMaker P5 インスタンスの製品詳細

インスタンスサイズ	vCPU	インスタンスメモリ (TiB)	GPU モデル	GPU	GPU メモリの合計 (GB)	GPU あたりのメモリ (GB)	ネットワーク帯域幅 (Gbps)	GPUDirect RDMA	GPU Peer to Peer	インスタンスストレージ (TB)	EBS 帯域幅 (Gbps)
ml.p5.48xlarge	192	2	NVIDIA H100	8	640 HBM3	80	3200 EFAv2	有	900 GB/秒 NVSwitch	8x3.84 NVMe SSD	80

Amazon SageMaker P4d インスタンスの製品詳細

インスタンスサイズ	vCPU	インスタンスメモリ (GiB)	GPU モデル	GPU	GPU メモリの合計 (GB)	GPU あたりのメモリ (GB)	ネットワーク帯域幅 (Gbps)	GPUDirect RDMA	GPU Peer to Peer	インスタンスストレージ (GB)	EBS 帯域幅 (Gbps)
ml.p4d.24xlarge	96	1152	NVIDIA A100	8	320 HBM 2	40	400 ENA および EFA	はい	600 GB/秒 NVSwitch	8x1000 NVMe SSD	19
ml.p4de.24xlarge	96	1152	NVIDIA A100	8	640 HNM2e	80	400 ENA および EFA	はい	600 GB/秒 NVSwitch	8X1000 NVMe SSD	19

Amazon SageMaker P3 インスタンスの製品詳細

インスタンスサイズ	vCPU	インスタンスメモリ (GiB)	GPU モデル	GPU	GPU メモリの合計 (GB)	GPU あたりのメモリ (GB)	ネットワーク帯域幅 (Gbps)	GPU Peer to Peer	インスタンスストレージ (GB)	EBS 帯域幅 (Gbps)
ml.p3.2xlarge	8	61	NVIDIA V100	1	16	16	最大 10	該当なし	EBS のみ	1.5
ml.p3.8xlarge	32	244	NVIDIA V100	4	64	16	10	NVLink	EBS のみ	7
ml.p3.16xlarge	64	488	NVIDIA V100	8	128	16	25	NVLink	EBS のみ	14
ml.p3dn.24xlarge	96	768	NVIDIA V100	8	256	32	100	NVLink	2 x 900 NVMeSSD	19

Amazon SageMaker P2 インスタンスの製品詳細

インスタンスサイズ	vCPU	インスタンスメモリ (GiB)	GPU モデル	GPU	GPU メモリの合計 (GB)	GPU あたりのメモリ (GB)	ネットワーク帯域幅 (Gbps)	EBS 帯域幅 (Gbps)
ml.p2.xlarge	4	61	NVIDIA K80	1	12	12	最大 10	高
ml.p2.8xlarge	32	488	NVIDIA K80	8	96	12	10	10
ml.p2.16xlarge	64	732	NVIDIA K80	16	192	12	25	20

Amazon SageMaker G4 インスタンスの製品詳細

インスタンスサイズ	vCPU	インスタンスメモリ (GiB)	GPU モデル	GPU	GPU メモリの合計 (GB)	GPU あたりのメモリ (GB)	ネットワーク帯域幅 (Gbps)	インスタンスストレージ (GB)	EBS 帯域幅 (Gbps)
ml.g4dn.xlarge	4	16	NVIDIA T4	1	16	16	最大 25	1 x 125 NVMe SSD	最大 3.5
ml.g4dn.2xlarge	8	32	NVIDIA T4	1	16	16	最大 25	1 x 125 NVMe SSD	最大 3.5
ml.g4dn.4xlarge	16	64	NVIDIA T4	1	16	16	最大 25	1 x 125 NVMe SSD	4.75
ml.g4dn.8xlarge	32	128	NVIDIA T4	1	16	16	50	1 x 900 NVMe SSD	9.5
ml.g4dn.16xlarge	64	256	NVIDIA T4	1	16	16	50	1 x 900 NVMe SSD	9.5
ml.g4dn.12xlarge	48	192	NVIDIA T4	4	64	16	50	1 x 900 NVMe SSD	9.5

Amazon SageMaker G5 インスタンスの製品詳細

インスタンスサイズ	vCPU	インスタンスメモリ (GiB)	GPU モデル	GPU	GPU メモリの合計 (GB)	GPU あたりのメモリ (GB)	ネットワーク帯域幅 (Gbps)	EBS 帯域幅 (Gbps)	インスタンスストレージ (GB)
ml.g5n.xlarge	4	16	NVIDIA A10G	1	24	24	最大 10	最大 3.5	1x250
ml.g5.2xlarge	8	32	NVIDIA A10G	1	24	24	最大 10	最大 3.5	1x450
ml.g5.4xlarge	16	64	NVIDIA A10G	1	24	24	最大 25	8	1x600
ml.g5.8xlarge	32	128	NVIDIA A10G	1	24	24	25	16	1x900
ml.g5.16xlarge	64	256	NVIDIA A10G	1	24	24	25	16	1x1900
ml.g5.12xlarge	48	192	NVIDIA A10G	4	96	24	40	16	1x3800
ml.g5.24xlarge	96	384	NVIDIA A10G	4	96	24	50	19	1x3800
ml.g5.48xlarge	192	768	NVIDIA A10G	8	192	24	100	19	2x3800

Amazon SageMaker Trn1 インスタンスの製品詳細

インスタンスサイズ	vCPU	メモリ (GiB)	Trainium アクセラレーター	アクセラレーターメモリの合計 (GB)	アクセラレーターあたりのメモリ (GB)	インスタンスストレージ (GB)	ネットワーク帯域幅 (Gbps)	EBS 帯域幅 (Gbps)
ml.trn1.2xlarge	8	32	1	32	32	1 x 500 NVMe SSD	最大 12.5	最大 20
ml.trn1.32xlarge	128	512	16	512	32	4 x 2000 NVMe SSD	800	80

Amazon SageMaker Inf1 インスタンスの製品詳細

インスタンスサイズ	vCPU	メモリ (GiB)	Inferentia アクセラレーター	アクセラレーターメモリの合計 (GB)	アクセラレーターあたりのメモリ (GB)	インスタンスストレージ	アクセラレーター間インターコネクト	ネットワーク帯域幅 (Gbps)	EBS 帯域幅 (Gbps)
ml.inf1.xlarge	4	8	1	8	8	EBS のみ	該当なし	最大 25	最大 4.75
ml.inf1.2xlarge	8	16	1	8	8	EBS のみ	該当なし	最大 25	最大 4.75
ml.inf1.6xlarge	24	48	4	32	8	EBS のみ	はい	25	4.75
ml.inf1.24xlarge	96	192	16	128	8	EBS のみ	有	100	19

Amazon SageMaker Inf2 インスタンスの製品詳細

インスタンスサイズ	vCPU	メモリ (GiB)	Inferentia アクセラレーター	アクセラレーターメモリの合計 (GB)	アクセラレーターあたりのメモリ (GB)	インスタンスストレージ	アクセラレーター間インターコネクト	ネットワーク帯域幅 (Gbps)	EBS 帯域幅 (Gbps)
ml.inf2.xlarge	4	16	1	32	32	EBS のみ	該当なし	最大 25	最大 10
ml.inf2.8xlarge	32	128	1	32	32	EBS のみ	該当なし	最大 25	10
ml.inf2.24xlarge	96	384	6	196	32	EBS のみ	有	50	30
ml.inf2.48xlarge	192	768	12	384	32	EBS のみ	はい	100	60

Amazon SageMaker Studio

Amazon SageMaker Studio は、完全な ML 開発を実現する単一のウェブベースのインターフェイスで、フルマネージド型の統合開発環境 (IDE) と専用ツールを選択できます。SageMaker Studio には無料でアクセスできます。SageMaker Studio 内のさまざまな IDE や ML ツールに使用した基盤となるコンピューティングとストレージに対してのみ課金されます。

SageMaker Studio、AWS SDK for Python (Boto3)、または AWS コマンドラインインターフェイス (AWS CLI) から、次のような多くのサービスを使用できます。

SageMaker Studio 上の IDE は、JupyterLab、コード OSS (Visual Studio Code - オープンソース) に基づくコードエディター、RStudio など、さまざまなフルマネージド IDE を使用して完全な ML 開発を実行できます
機械学習ワークフローを自動化および管理する SageMaker Pipelines
完全な可視性を備えた機械学習モデルを自動的に作成する SageMaker Autopilot
トレーニングジョブとバージョンを整理および追跡する SageMaker Experiments
トレーニング中に異常をデバッグする SageMaker Debugger
高品質のモデルを維持する SageMaker Model Monitor
機械学習モデルをより適切に説明しバイアスを検出する SageMaker Clarify
多くのユースケースに機械学習ソリューションを簡単にデプロイする SageMaker JumpStart。ソリューションで使用される他の AWS のサービスから、Amazon SageMaker がお客様に代わって行う、基盤となる API コールの料金が課金される場合があります。
適切なエンドポイント設定のレコメンデーションを取得するための SageMaker Inference Recommender

使用量に基づいて、SageMaker 内の基盤となるコンピューティングおよびストレージリソースまたは他の AWS のサービスについての料金のみをお支払いいただきます。

Jupyter Lab とコードエディタで Amazon Q Developer 無料利用枠を使用するには、こちらの手順に従ってください。Jupyter Lab で Amazon Q Developer Pro を使用するには、Amazon Q Developer に登録する必要があります。Amazon Q Developer の料金はこちらで確認できます。

基礎モデル評価

SageMaker Clarify は、自動評価方法と人間ベースの評価方法の両方で基礎モデル評価をサポートしています。これらはそれぞれ価格が異なります。アカウントにまだデプロイされていない Amazon SageMaker JumpStart の基盤モデルを評価している場合、SageMaker は推論の間、SageMaker インスタンスに JumpStart モデルを一時的にデプロイします。特定のインスタンスは、そのモデルについて JumpStart が提供する推奨インスタンスに準拠します。

自動評価:
ファンデーションモデルの評価は SageMaker の処理ジョブとして実行されます。評価ジョブは SageMaker 推論を呼び出します。お客様には、推論と評価ジョブの料金がかかります。お客様への請求は、評価ジョブの期間中のみ行われます。評価ジョブのコストは、評価インスタンスの 1 時間あたりのコストとホスティングインスタンスの 1 時間あたりのコストの合計になります。

人間ベースの評価：
人力ベースの評価機能を使用して従業員を派遣する場合、1) 推論に使用される SageMaker インスタンス、2) 人間による評価をホストする SageMaker 処理ジョブの実行に使用されるインスタンス、3) 完了した人的評価タスクにつき 0.21 USD の料金の 3 項目について課金されます。ヒューマンタスクとは、人間の作業者が単一のプロンプトとそれに関連する推論応答の評価をヒューマン評価ユーザーインターフェイスに送信したこととして定義されます。評価業務に1つまたは2つのモデルがある場合でも、独自の推論を持ち込んでも価格は同じです。また、評価ディメンションと評価方法をいくつ含めても同じです。1 タスクあたり 0.21 USD の料金は、すべての AWS リージョンで同じです。人件費はお客様負担となりますので、別途人件費はかかりません。

AWS が管理する評価:
AWS が管理する専門家による評価では、AWS 専門家評価チームと連携しながら、プライベート契約でお客様の評価ニーズに合わせて価格をカスタマイズします。

Amazon SageMaker Studio Lab

Amazon SageMaker Studio Lab を使用して、機械学習モデルを無料で構築およびトレーニングできます。 SageMaker Studio Lab は、デベロッパー、学者、データサイエンティストに、追加料金なしで機械学習について学び実験するための設定なしで開発できる環境を提供します。

Amazon SageMaker Canvas

Amazon SageMaker Canvas は、ビジネスアナリストが、視覚的なポイントアンドクリックインターフェイスを使用して正確な機械学習予測を生成することができるようにすることで、機械学習を利用しやすくします。コーディングや、機械学習の経験は必要ありません。

Amazon SageMaker Data Labeling

Amazon SageMaker Data Labeling は、Amazon SageMaker Ground Truth Plus と Amazon SageMaker Ground Truth の 2 つのデータラベリングサービスを提供します。フルマネージド型のデータラベル付けサービスで、機械学習のための高精度なトレーニングデータセットを簡単に構築することができる Amazon SageMaker Data Labeling の詳細をご覧ください。

Amazon SageMaker のシャドウテスト

SageMaker は、新しい機械学習モデルを本番リリース前に評価するために、現在デプロイされているモデルに対してそのパフォーマンスをテストするシャドーテストの実行を支援します。シャドウモデルをホストするためにプロビジョニングされた ML インスタンスと ML ストレージの使用料金を除いて、SageMaker シャドウテストに追加料金はかかりません。ML インスタンスと ML ストレージディメンションの料金は、前の料金表で指定されているリアルタイム推論オプションと同じです。シャドウデプロイメントの内外で処理されるデータに追加料金はかかりません。

Amazon SageMaker Edge

エッジデバイスのフリートで機械学習モデルを最適化、実行、およびモニタリングするための Amazon SageMaker Edge の料金設定について、詳細をご覧ください。

Amazon SageMaker Savings Plans

Amazon SageMaker Savings Plans は、コストを最大 64% 削減するのに役立ちます。このプランは、インスタンスファミリー、サイズ、リージョンに関係なく、SageMaker Studio ノートブック、SageMaker ノートブックインスタンス、SageMaker Processing、SageMaker Data Wrangler、SageMaker Training、SageMaker Real-Time Inference、SageMaker Batch Transform などの対象となる SageMaker 機械学習インスタンスの使用量に自動的に適用されます。例えば、米国東部 (オハイオ) で実行されている CPU インスタンス ml.c5.xlarge から米国西部 (オレゴン) の ml.Inf1 インスタンスにいつでも推論ワークロードの使用量を変更し、自動的に Savings Plans の料金を引き続き支払うことができます。

詳細はこちら »

Amazon SageMaker で総保有コスト (TCO)

Amazon SageMaker は、他のクラウドベースのセルフマネージドソリューションと比較して、3 年間で総保有コスト (TCO) を少なくとも 54% 削減します。Amazon SageMaker の TCO 分析について、詳細をご覧ください。

料金の例

料金例 #1: JupyterLab

データサイエンティストは、JupyterLab を 20 日間使用して、ml.g4dn.xlarge インスタンスで 1 日あたり 6 時間、ノートブック、コード、データをすばやく実験します。JupyterLab IDE にアクセスするには、JupyterLab スペースを作成して実行します。コンピューティングは、JupyterLab スペースが実行されているときに使用されたインスタンスに対してのみ課金されます。JupyterLab スペースのストレージ料金は、削除されるまで発生します。

コンピューティング

インスタンス	期間	日数	合計期間	1 時間あたりのコスト	合計
ml.g4dn.xlarge	6 時間	20	6 × 20 = 120 時間	0.7364ドル	88.368ドル

ストレージ

汎用 SSD ストレージは 480 時間 (24 時間 × 20 日間) 使用できます。1 か月あたり 1 GB あたり 0.1125 USD を請求するリージョンの場合:
1 GB あたり 0.112 USD* 5 GB * 480/(24 時間/日 * 30 日間) = 0.373 USD

料金例 #2: コードエディター

ML エンジニアは、ml.g4dn.xlarge インスタンスで 20 日間、ML プロダクションコードの編集、実行、およびデバッグにコードエディターを使用して、1 日あたり 6 時間費やします。コードエディタ IDE にアクセスするには、コードエディタスペースを作成して実行します。コンピュート料金は、コードエディタースペースが実行されているときに使用されたインスタンスに対してのみ課金されます。コードエディタスペースのストレージ料金は、削除されるまで発生します。

コンピューティング

インスタンス	期間	日数	合計期間	1 時間あたりのコスト	合計
ml.g4dn.xlarge	6 時間	20	6 × 20 = 120 時間	0.7364ドル	88.368ドル

ストレージ

料金例 #3: スタジオクラシック

データサイエンティストは、Amazon SageMaker Studio ノートブックを使用しながら次の一連のアクションを実行します。

ml.c5.xlarge インスタンスの TensorFlow カーネルでノートブック 1 を開き、このノートブックで 1 時間作業を行います。
ml.c5.xlarge インスタンスでノートブック 2 を開きます。ノートブック 1 を実行しているインスタンスと同じ ml.c5.xlarge インスタンスで自動的に開きます。
ノートブック 1 とノートブック 2 で同時に 1 時間動作します。
データサイエンティストには、ml.c5.xlarge を使用した合計 2 時間分の料金が請求されます。ノートブック 1 とノートブック 2 で同時に行った重複作業時間の場合、各カーネルアプリケーションは 0.5 時間として計測され、1 時間分が請求されます。

カーネルアプリケーション	ノートブックインスタンス	時間	1 時間あたりのコスト	合計
TensorFlow	ml.c5.xlarge	1	0.204 USD	0.204 USD
TensorFlow	ml.c5.xlarge	0.5	0.204 USD	0.102 USD
データサイエンス	ml.c5.xlarge	0.5	0.204 USD	0.102 USD
				0.408 USD

料金の例 #4: RStudio

データサイエンティストは、RStudio を使用しながら次の一連のアクションを実行します。

ml.c5.xlarge インスタンスで RSession 1 を起動し、このノートブックで 1 時間作業を行います。
ml.c5.xlarge インスタンスで RSession 2 を起動します。RSession 1 を実行しているインスタンスと同じ ml.c5.xlarge インスタンスで自動的に開きます。
RSession 1 と RSession 2 を同時に 1 時間使用します。
データサイエンティストには、ml.c5.xlarge を使用した合計 2 時間分の料金が請求されます。RSession 1 と RSession 2 で同時に行った重複作業時間の場合、各 RSession アプリケーションは 0.5 時間として計測され、1 時間分が請求されます。

その間、RSessions が動いているか否かにかかわらず、RServer は 24 時間 365 日動いています。管理者が「スモール」(ml.t3.medium) を選択した場合は、無料で利用できます。管理者が「ミディアム」(ml.c5.4xlarge) または「ラージ」(ml.c5.9xlarge) を選択した場合、SageMaker ドメインで RStudio が有効になっている限り、時間単位で料金が発生します。

RSession アプリケーション	RSession インスタンス	時間	1 時間あたりのコスト	合計
Base R	ml.c5.xlarge	1	0.204 USD	0.204 USD
Base R	ml.c5.xlarge	0.5	0.204 USD	0.102 USD
Base R	ml.c5.xlarge	0.5	0.204 USD	0.102 USD
				0.408 USD

料金の例 #5: 処理

Amazon SageMaker Processing は、ジョブが実行されている間に使用されたインスタンスのみ料金がかかります。Simple Storage Service (Amazon S3) の処理向けにインプットデータを提供する場合、Amazon SageMaker は、ジョブの処理開始時に Simple Storage Service (Amazon S3) からローカルファイルストレージにデータをダウンロードします。

データ分析は、10分のジョブ時間にて2 ml.m5.4xlarge で処理ジョブを実行してデータを処理、有効します。処理ジョブのインプットとして S3 の 100 GB のデータセットをアップロードします。また、アウトプットデータ (ほぼ同じサイズ) が S3 に戻されて保存されます。

時間	処理インスタンス	1 時間あたりのコスト	合計
1 * 2 * 0.167 = 0.334	ml.m5.4xlarge	0.922 USD	0.308 USD

汎用 (SSD) ストレージ (GB)	1 時間あたりのコスト	合計
100 GB * 2 = 200	0.14 USD	0.0032 USD

Amazon SageMaker 処理ジョブの小計 = 0.308 USD。
200 GB 汎用 SSD ストレージの小計 = 0.0032 USD。
この例の総額は 0.3112 USD です。

料金の例 #6: Data Wrangler

表に基づくと、データを準備するために、Amazon SageMaker Data Wrangler を 3 日間にわたって合計 18 時間使用します。さらに、SageMaker Data Wrangler ジョブを作成して、更新されたデータを毎週準備します。各ジョブは 40 分続き、ジョブは 1 か月間毎週実行されます。

Data Wrangler の使用にかかる合計月額料金 = 16.596 USD + 2.461 USD = 19.097 USD

アプリケーション	SageMaker Studio インスタンス	日数	期間	合計期間	1 時間あたりのコスト	費用小計
SageMaker Data Wrangler	ml.m5.4xlarge	3	6 時間	18 時間	0.922 USD	16.596 USD
SageMaker Data Wrangler ジョブ	ml.m5.4xlarge	-	40 分	2.67 時間	0.922 USD	2.461 USD

データサイエンティストとして、3 日間にわたり、Amazon SageMaker Data Wrangler を使用してデータを 1 日 6 時間クレンジング、探索、および視覚化します。その後、データ準備パイプラインを実行するために、毎週実行するようにスケジュールされている SageMaker Data Wrangler ジョブを開始します。

以下の表は、その月の合計使用量と、Amazon SageMaker Data Wrangler の使用に関連して発生する料金をまとめたものです。

料金の例 #7: 特徴量ストア

++ すべての小数の読み取り単位は次の整数に丸められます

データストレージ
保存されたデータの合計 = 31.5 GB
データストレージの月額料金 = 31.5 GB * 0.45 USD = 14.175 USD

Amazon SageMaker Feature Store の月額合計料金 = 56.875 USD + 3.185 USD + 14.175 USD = 74.235 USD

その月における日	書き込み総数	合計書き込みユニット	読み込み総数	合計読み取りユニット
1～10 日	100,000 回の書き込み (10,000 回の書き込み * 10 日間)	2,500,000 (100,000 * 25KB)	100,000 (10,000 * 10 日間)	700,000++ (100,000 * 25/4 KB)

11 日目	200,000 回の書き込み	5,000,000 (200,000 * 25KB)	200,000 回の読み取り	1,400,000++ (200,000* 25/4KB)

12～30 日	1,520,000 回の書き込み (80,000 * 19 日間)	38,000,000 (1,520,000 * 25KB)	1,520,000 回の書き込み (80,000 * 19 日間)	10,640,000++ (1,520,000 * 25/4KB)

合計請求対象ユニット		45,500,000 書き込みユニット		12,740,000 読み取りユニット
書き込みと読み取りの月額料金		56.875 USD (4,550 万書き込みユニット * 100 万書き込みあたり 1.25 USD)		3.185 USD (1,274 万読み取りユニット * 100 万読み取りあたり 0.25 USD)

Amazon SageMaker Feature Store に対してそれぞれ 25 KB の読み取りと書き込みを発行するウェブアプリケーションがあります。月の最初の 10 日間は、アプリケーションへのトラフィックがほとんどなく、SageMaker Feature Store への書き込みと読み取りは毎日それぞれ 10,000 回発生します。その月の 11 日にアプリケーションがソーシャルメディアで注目を集めたため、その日の書き込みと読み取りはそれぞれ 200,000 回となり、アプリケーションのトラフィックが跳ね上がりました。その後、アプリケーションは通常のトラフィックのパターンに落ち着き、月末まで 1 日平均の書き込みと読み取りはそれぞれ 80,000 回となりました。

以下の表は、その月の合計使用量と、Amazon SageMaker Feature Store の使用に関連して発生する料金をまとめたものです。

料金の例 #8: トレーニング

この例でのデバッグおよびトレーニングの総額は、2.38 USD です。コンピューティングインスタンスと、Amazon SageMaker Debugger 組み込みルールで使用される汎用ストレージボリュームについては、追加料金は発生しません。

	トレーニング用汎用 (SSD) ストレージ (GB)	デバッガ―ビルトインルール用汎用 (SSD) ストレージ (GB)	デバッガ―カスタムルール用汎用 (SSD) ストレージ (GB)	GB あたりの月額料金	小計
使用容量	3	2	1
料金	0 USD	ビルトインストレージボリュームに追加料金は発生しません	0 USD	0.10 USD	0 USD

時間	トレーニングインスタンス	デバッグインスタンス	1 時間あたりのコスト	小計
4 * 0.5 = 2.00	ml.m4.4xlarge	該当なし	0.96 USD	1.92 USD
4 * 0.5 * 2 = 4	該当なし	ビルトインインスタンスに追加料金は発生しません	0 USD	0 USD
4 * 0.5 = 2	ml.m5.xlarge	該当なし	0.23 USD	0.46 USD
				-------
				2.38 USD

データサイエンティストが新しい考えに対するモデルについて 1 週間仕事をしたとします。彼女は、作成した 2 つのビルトインルールと 1 つのカスタムルールを使用して Amazon SageMaker デバッガーを有効にして、トレーニング実行ごとに 30 分間、ml.m4.4xlarge でモデルを 4 回トレーニングします。カスタムルールでは、ml.m5.xlarge インスタンスを特定しました。Simple Storage Service (Amazon S3) の 3 GB トレーニングデータを使用してトレーニングを行い、1 GB モデルアウトプットを Simple Storage Service (Amazon S3) に押し込めます。SageMaker は、各トレーニングインスタンス用に、汎用 SSD (gp2) ボリュームを作成します。SageMaker はまた、特定された各ルール用にも汎用 SSD (gp2) ボリュームを作成します。この例では、合計で 4 つの汎用 SSD (gp2) ボリュームが作成されます。SageMaker デバッガ―は、お客様の Simple Storage Service (Amazon S3) バケットに 1 GB のデバッグデータを送信します。

料金の例 #9: MLflow

データサイエンティストのチームが 2 つあります。1 つのチームには 10 人のデータサイエンティストが所属しており、もう 1 つのチームには 40 人のデータサイエンティストが所属しています。これらの 2 つのチームに対応するために、2 つの異なる MLflow トラッキングサーバー (1 つは Small、もう 1 つは Medium) を有効にすることを選択します。各チームは機械学習 (ML) 実験を実施しており、トレーニングの試行によって生成されたメトリクス、パラメータ、およびアーティファクトを記録する必要があります。チームは MLflow トラッキングサーバーを 1 か月あたり 160 時間使用したいと考えています。各データサイエンスチームが実験の実行を追跡するために 1 GB のメタデータを保存すると仮定します。月末に発行される請求書は、次のように計算されます。

Small インスタンスのコンピューティング料金: 160 * 0.60 USD = 96 USD
Medium インスタンスのコンピューティング料金: 160 * 1.40 USD = 166.4 USD
2 つのチームのストレージ料金: 2 * 1 * 0.10 = 0.20 USD

合計 = 262.60 USD

料金の例 #10: リアルタイム推論

トレーニング、ホスティング、およびモニタリングの小計 = 305.827 USD。毎月のホスティングのための入力データ処理量 3,100 MB と出力データ処理量 310 MB の小計 = 0.054 USD。この例の合計料金は、月額 305.881 USD になります。

ml.m5.xlarge インスタンスのビルトインルールでは、毎月すべてのエンドポイントで集計モニタリング時間が最大 30 時間無料になります。

1 か月あたりデータの入力 - ホスティング	月あたりデータ出力 – ホスティング	入力または出力料金 (GB 単位)	合計
100 MB * 31 = 3,100 MB		0.016 USD	0.0496 USD
	10 MB * 31 = 310 MB	0.016 USD	0.00496 USD

1 か月あたりの時間	ホスティングインスタンス	モデルモニターインスタンス	1 時間あたりのコスト	合計
24 * 31 * 2 = 1488	ml.c5.xlarge		0.204 USD	303.522 USD
31*0.08 = 2.5		ml.m5.4xlarge	0.922 USD	2.305 USD

その後、例 #5 のモデルは、信頼性の高いマルチ AZ ホスティングのために、2 つの ml.c5.xlarge インスタンスに本番としてデプロイされます。Amazon SageMaker Model Monitor は、1 つの ml.m5.4xlarge インスタンスで有効化され、1 日 1 回、ジョブがモニタリングされます。各ジョブのモニタリングは完了するまで5分かかります。このモデルはデータを毎日 100 MB を受信し、インファレンスは入力データのサイズの 10 分の 1 でした。

料金の例 #11: 非同期推論

SageMaker 非同期推論の小計 = 15.81 USD + 0.56 USD + 2 * .0048 = 16.38 USD。この例の非同期推論の合計料金は、月額 16.38 USD になります。

月あたりデータ入力	月あたりデータ出力	入力または出力料金 (GB 単位)	合計
10 KB * 1,024 * 31 = 310 MB	10 KB * 1,024 * 31 = 310 MB	0.02 USD	0.0048
	10 KB * 1,024 * 31 = 310 MB	0.02 USD	0.0048

汎用 (SSD) ストレージ (GB)	GB あたりの月額料金	合計
4	0.14 USD	0.56 USD

1 か月あたりの時間	ホスティングインスタンス	1 時間あたりのコスト	合計
2.5 * 31 * 1 = 77.5	ml.c5.xlarge	0.20 USD	15.81 USD

Amazon SageMaker 非同期推論は、エンドポイントで使用されるインスタンスに対して課金されます。アクティブにリクエストを処理していないときは、コストを節約するためにインスタンスをゼロにスケールするようにオートスケーリングを設定できます。Simple Storage Service (Amazon S3) の入力ペイロードの場合、同じリージョンでの Simple Storage Service (Amazon S3) からの入力データの読み取りや S3 への出力データの書き込みにコストは発生しません。

例 #5 のモデルは、SageMaker 非同期推論エンドポイントを実行するために使用されます。このエンドポイントは、1 つの ml.c5.xlarge インスタンスで実行され、アクティブにリクエストを処理していないときは、インスタンスをゼロにスケールダウンするように設定されています。エンドポイントの ml.c5.xlarge インスタンスには，4 GB の汎用 (SSD) ストレージが接続されています。この例では、エンドポイントは 1 日 2 時間、インスタンス 1 を維持し、30 分間のクールダウン期間を経て、残りの時間はインスタンス 0 にスケールダウンします。したがって、1 日あたり 2.5 時間の使用に対して課金されます。

エンドポイントは 1 日あたり 1,024 件のリクエストを処理します。各呼び出しリクエスト/レスポンスボディのサイズは 10 KB で、Simple Storage Service (Amazon S3) の各推論リクエストペイロードは 100 MB です。推論出力は入力データの 1/10 のサイズで、同じリージョンの Simple Storage Service (Amazon S3) に戻って保存されます。この例では、データ処理料金はリクエストとレスポンスボディに適用されますが、Simple Storage Service (Amazon S3) との間で転送されるデータには適用されません。

料金の例 #12: バッチ変換

この例での推論料金の合計は 2.88 USD です。

時間	ホスティングインスタンス	1 時間あたりのコスト	合計
3 * 0.25 * 4 = 3 時間	ml.m4.4xlarge	0.96 USD	2.88 USD

例 #5 のモデルを使用して SageMaker バッチ変換を実行します。データサイエンティストは、3 個の ml.m4.4xlarge 上で 4 つの別々の SageMaker バッチ変換ジョブを、1 回のジョブ実行につき 15 分間実行します。実行ごとに 1 GB の評価データセットを S3 にアップロードし、推論のサイズは入力データの 1/10 で、S3 に戻って保存されます。

料金の例 #13: オンデマンド Serverless Inference

月額データ処理料金

データ処理 (GB)	入力または出力料金 (GB 単位)	月額データ処理料金
10 GB	0.016 USD	0.16 USD

オンデマンド SageMaker Serverless Inference 期間料金の小計 = 40 USD。10 GB のデータ処理料金の小計 = 0.16 USD。この例の合計請求額は 40.16 USD です。

月額コンピューティング料金

リクエストの数	各リクエストの期間	合計推論時間 (秒)	1 秒あたりのコスト	月額推論期間料金
1000 万	100 ms	100 万	0.00004 USD	40 USD

オンデマンドの Serverless Inference では、推論要求の処理に使用されるコンピューティング性能、ミリ秒単位の請求、および処理されるデータの量に対してのみ料金を支払います。コンピューティング料金は、選択したメモリ設定によって異なります。

エンドポイントに 2 GB のメモリ量を割り当て、1 か月に 1,000 万回実行し、毎回 100 ミリ秒間実行し、合計 10 GB のデータ入力/出力を処理した場合、料金の計算は以下のようになります。

料金の例 #14: サーバーレス推論におけるプロビジョニングされた同時実行

給与処理会社向けのチャットボットサービスを運営しているとしましょう。税務申告期限前の 3 月末には、顧客からの問い合わせが急増すると予想されます。ただし、当月のそれ以外の期間は、トラフィックは少ないと予想されます。つまり、2 GB のメモリを搭載したサーバーレスエンドポイントをデプロイし、月の最後の 5 日間、午前 9 時～午後 5 時 (8 時間) にプロビジョニングされた同時実行数を 100 個追加します。その間、エンドポイントは 1,000 万件のリクエスト、合計 10,000 GB のデータ入出力を処理します。今月のそれ以外の期間は、チャットボットはオンデマンドの Serverless Inference で稼働し、300 万のリクエストと 3GB のデータ入出力を処理します。各リクエストの持続時間を 100 ミリ秒と仮定しましょう。

プロビジョニングされた同時実行数 (PC) 料金:
PC の価格は 0.000010 ドル/秒
PC 使用時間 (秒) = 5 日* 100 PC* 8 時間* 3600 秒 = 14,400,000 秒
PC 使用料 = 14,400,000 秒* 0.000010 ドル/秒 = 144 ドル。

プロビジョニングされた同時実行性によって処理されるトラフィックの推論時間料金
推論時間の料金は 1 秒あたり 0.000023 ドル
PC の推論時間の合計 (秒) = 10M* (100 ミリ秒) /1000 = 100 万秒。
PC の推論時間料金 = 1,000,000 秒 * 0.000023 ドル/秒 = 23 ドル

オンデマンド推論時間料金
1 か月のコンピューティング料金は 1 秒につき 0.00004 USD で、無料利用枠は 150,000 秒です。
合計コンピューティング (秒) = (3) M * (100 ミリ秒) /1000 = 30 万秒。
合計コンピューティング – 無料利用枠 = 1 か月の請求コンピューティング秒
30 万秒 - 15万秒 = 15万秒
1 か月のコンピューティング料金 = 150k * 0.00004 USD = 6 USD

データ処理
イン/アウト処理されるデータの GB あたりのコスト = 0.016 USD
処理された合計ギガバイト数 = 10+3 = 13
合計コスト= 0.016 USD *13= 0.208 USD

3 月の合計料金
合計料金 = プロビジョニングされた同時実行料金 + プロビジョニングされた同時実行の推論時間 + オンデマンドコンピューティングの推論時間 + データ処理料金
= 144 USD + 23 USD + 6 USD + 0.208 USD = 173.2 USD

料金の例 #15: JumpStart

お客様は JumpStart を使用して、お客様レビューのセンチメントを肯定的または否定的に分類するために事前にトレーニングされた BERT Base Uncased モデルをデプロイします。

この顧客は、信頼性の高いマルチ AZ ホスティングのために、2 つの ml.c5.xlarge インスタンスにモデルをデプロイします。このモデルはデータを毎日 100 MB を受信し、インファレンスは入力データのサイズの 10 分の 1 でした。

1 か月あたりの時間	ホスティングインスタンス	1 時間あたりのコスト	合計
24 * 31 * 2 = 1488	ml.c5.xlarge	0.204 USD	303.55 USD

1 か月あたりデータの入力 - ホスティング	月あたりデータ出力 – ホスティング	入力または出力料金 (GB 単位)	合計
100 MB * 31 = 3,100 MB		0.02 USD	0.06 USD
	10 MB * 31 = 310 MB	0.02 USD	0.01 USD

トレーニング、ホスティング、およびモニタリングの小計 = 305.827 USD。毎月のホスティングのための入力データ処理量 3,100 MB と出力データ処理量 310 MB の小計 = 0.06 USD。この例の合計料金は、月額 305.887 USD になります。

料金の例 #16: HyperPod クラスター

モデル開発をサポートするために、インスタンスごとに追加の 100 GB のストレージを備えた 4 個の ml.g5.24xlarge のクラスターを 1 か月間 (30 日間) プロビジョニングするとします。 この例では、クラスターと追加のストレージの合計料金は 29,374.40 です。

コンピューティング

インスタンス	期間	インスタンス	1 時間あたりのコスト	小計
ml.g5.24xlarge	30 日間 * 24 時間 = 720 時間	4	10.18 USD	29,318.40 USD

ストレージ

汎用 (SSD) ストレージ	期間	インスタンス	GB-月あたりの料金	小計
100 GB	30 日間 * 24 時間 = 720 時間	4	0.14 USD	56.00 USD

料金例 #17: 基盤モデルの評価 (自動評価)

SageMaker Clarify による基盤モデル評価では、自動評価ジョブの実行中に使用されたインスタンスに対してのみ課金されます。自動評価タスクとデータセットを選択すると、SageMaker は Amazon S3 のプロンプトデータセットを SageMaker 評価インスタンスにロードします。

次の例では、ML エンジニアが米国東部 (バージニア北部) で Llama2 7B モデルの要約タスクの精度を評価しています。Llama 2 7B の推論に推奨されるインスタンスタイプは ml.g5.2xlarge です。評価に推奨される最小インスタンスは ml.m5.2xlarge です。この例では、ジョブは 45 分間実行されます (データセットのサイズによって異なります)。この例では、評価作業と詳細な結果のコストは 1.48 USD になります。

ジョブ時間の処理 (例)	リージョン	インスタンスタイプ	インスタンス	1 時間あたりのコスト	料金
0.45	US-east-1	LLM ホスティング	ml.g5.2xlarge	1.52 USD	1.14 USD
0.45	US-east-1	評価	ml.m5.2xlarge	0.46 USD	0.35 USD
合計					1.48 USD

次の例では、バージニア州の同じエンジニアが、要約タスクの精度を高めるために別の評価ジョブを実行していますが、Llama 2 7B のカスタマイズバージョンを使用してアカウントにデプロイし、稼働させています。この場合、モデルはすでにアカウントにデプロイされているため、追加コストは評価インスタンスのみになります。

ジョブ時間の処理	リージョン	インスタンスタイプ	インスタンス	1 時間あたりのコスト	料金
0.45	US-east-1	評価	ml.m5.2xlarge	0.46 USD	0.35 USD
合計					0.35 USD

料金例 #18: 基盤モデルの評価 (人間ベースの評価)

次の例では、米国東部 (バージニア北部) の機械学習エンジニアが、Llama-2-7B の要約タスクの正確性を人間ベースで評価し、その評価には各自の個人スタッフを使用しています。ラマ2-7B の推奨インスタンスタイプは ml.g5.2xlarge です。人間ベースの評価処理ジョブの推奨最小インスタンスは ml.t3.medium です。Llama-2-7B での推論は45分間実行されます (データセットのサイズによって異なります)。データセットには 50 個のプロンプトが含まれており、開発者は各プロンプト/応答セットを評価するために 2 人のワーカーを必要とします (評価ジョブの作成で「プロンプトあたりのワーカー数」パラメーターとして設定可能)。この評価ジョブには 100 個のタスクが含まれます (各ワーカーごとにプロンプト/レスポンスのペアごとに 1 つのタスク:2 人の作業者 x 50 個のプロンプト応答セット = 100 個のヒューマンタスク)。評価作業における100件の評価タスクをすべて完了するには、人員が1日 (24時間) かかります (作業者の数とスキルレベル、プロンプトと推論応答の長さ/複雑さによって異なります)。

コンピューティング時間	ヒューマンタスク	リージョン	インスタンスタイプ	インスタンス	1 時間あたりのコスト	ヒューマンタスクあたりのコスト	合計コスト
0.45		米国東部 (バージニア北部)	LLM ホスティング	ml.g5.2xlarge	1.52 USD		1.14 USD
24		米国東部 (バージニア北部)	処理ジョブ	ml.t3.medium	0.05 USD		1.20 USD
	100	任意				0.21 USD	21.00 USD
合計							23.34 USD

次の例では、米国東部 (バージニア北部) の同じエンジニアが同じ評価ジョブを実行していますが、アカウントに既にデプロイされて稼働している Llama-2-7B を使用しています。この場合、唯一の増加コストは、評価処理ジョブとヒューマンタスクにかかるコストになります。

コンピューティング時間	ヒューマンタスク	リージョン	インスタンスタイプ	インスタンス	1 時間あたりのコスト	ヒューマンタスクあたりのコスト	合計コスト
24		米国東部 (バージニア北部)	処理ジョブ	ml.t3.medium	0.05 USD		1.20 USD
	100	任意				0.21 USD	21.00 USD
合計							22.20

次のステップ

Feature Page

SageMaker のさまざまな機能をご覧ください

詳細

Console

AWS マネジメントコンソールから SageMaker を使った構築を開始しましょう

サインアップ

Amazon SageMaker の料金

料金設定の概要

Amazon SageMaker 無料利用枠

AWS 料金計算ツール

オンデマンド料金

インスタンスの詳細

Amazon SageMaker Studio

基礎モデル評価

Amazon SageMaker Studio Lab

Amazon SageMaker Canvas

Amazon SageMaker Data Labeling

Amazon SageMaker のシャドウテスト

Amazon SageMaker Edge

Amazon SageMaker Savings Plans

Amazon SageMaker で総保有コスト (TCO)

料金の例

料金例 #1: JupyterLab

料金例 #2: コードエディター

料金例 #3: スタジオクラシック

料金の例 #4: RStudio

料金の例 #5: 処理

料金の例 #6: Data Wrangler

料金の例 #7: 特徴量ストア

料金の例 #8: トレーニング

料金の例 #9: MLflow

料金の例 #10: リアルタイム推論

料金の例 #11: 非同期推論

料金の例 #12: バッチ変換

料金の例 #13: オンデマンド Serverless Inference

料金の例 #14: サーバーレス推論におけるプロビジョニングされた同時実行

料金の例 #15: JumpStart

料金の例 #16: HyperPod クラスター

料金例 #17: 基盤モデルの評価 (自動評価)

料金例 #18: 基盤モデルの評価 (人間ベースの評価)

次のステップ

SageMaker のさまざまな機能をご覧ください

AWS マネジメントコンソールから SageMaker を使った構築を開始しましょう

Amazon SageMaker の料金

料金設定の概要

Amazon SageMaker 無料利用枠

AWS 料金計算ツール

オンデマンド料金

インスタンスの詳細

Amazon SageMaker Studio

基礎モデル評価

Amazon SageMaker Studio Lab

Amazon SageMaker Canvas

Amazon SageMaker Data Labeling

Amazon SageMaker のシャドウテスト

Amazon SageMaker Edge

Amazon SageMaker Savings Plans

Amazon SageMaker で総保有コスト (TCO)

料金の例

料金例 #1: JupyterLab

料金例 #2: コードエディター

料金例 #3: スタジオクラシック

料金の例 #4: RStudio

料金の例 #5: 処理

料金の例 #6: Data Wrangler

料金の例 #7: 特徴量ストア

料金の例 #8: トレーニング

料金の例 #9: MLflow

料金の例 #10: リアルタイム推論

料金の例 #11: 非同期推論

料金の例 #12: バッチ変換

料金の例 #13: オンデマンド Serverless Inference

料金の例 #14: サーバーレス推論におけるプロビジョニングされた同時実行

料金の例 #15: JumpStart

料金の例 #16: HyperPod クラスター

料金例 #17: 基盤モデルの評価 (自動評価)

料金例 #18: 基盤モデルの評価 (人間ベースの評価)

次のステップ

SageMaker のさまざまな機能をご覧ください

AWS マネジメントコンソールから SageMaker を使った構築を開始しましょう

Internet Explorer のサポートの終了