Übersicht
Mit Amazon Redshift können Sie mit einem Preis von 0,25 USD pro Stunde klein anfangen und Ihr System auf Petabyte an Daten und Tausende gleichzeitige Benutzer skalieren. Sie können einen Ressourcenumfang wählen, der zu Ihren Geschäftsanforderungen passt. Das ermöglicht Ihnen, den Speicher zu erweitern und eine Überbereitstellung zu vermeiden. Mit bereitgestelltem Amazon Redshift können Sie On-Demand-Instances auswählen und Ihre Datenbank stundenweise bezahlen, ohne langfristige Verpflichtungen oder Vorauszahlungen, oder Sie können Reserved Instances auswählen, um zusätzlich zu sparen. Alternativ ermöglicht Ihnen Amazon Redshift Serverless die nutzungsbasierte Zahlung mit automatischem Hoch- und Herunterfahren sowie Kapazitätsskalierung je nach Anwendungsanforderungen. Dadurch zahlen Sie nur für Kapazitäten, die für die Verarbeitung der Workload verbraucht werden.
Vorteile von bereitgestelltem Amazon Redshift:
Zuerst sollten Sie sich mit den verschiedenen Knotentypen vertraut machen, um die beste Clusterkonfiguration für Ihre Anforderungen auswählen zu können. Sie können Ihren Cluster jederzeit mit einem einzigen API-Aufruf oder wenigen Klicks in der Redshift-Konsole skalieren, pausieren, erneut aktivieren oder zwischen Knotentypen wechseln. Die On-Demand-Preise werden Ihnen vor Ihrer Auswahl angezeigt und Sie können später jederzeit reservierte Knoten erwerben, um sich erhebliche Einsparungen zu sichern.
Wenn Sie eine Auswahl getroffen haben, sollten Sie Elastic Resize verwenden, um die bereitgestellte Rechenkapazität innerhalb weniger Minuten anzupassen und eine unterbrechungsfreie Verarbeitung zu gewährleisten. Mit Resize Scheduler können Sie Knoten täglich oder wöchentlich hinzufügen und entfernen, um die Kosten zu optimieren und die beste Leistung zu erzielen. Für dynamische Workloads können Sie Concurrency Scaling verwenden, um automatisch zusätzliche Rechenkapazität bereitzustellen und nur für Ressourcen zu zahlen (mit sekundenbasierter Abrechnung), nachdem die kostenlosen Credits aufgebraucht wurden (siehe Preise für Concurrency Scaling).
AWS Pricing Calculator
Berechnen Sie den Preis für Ihre Amazon-Redshift- und -Architekturkosten in einer einzigen Kostenschätzung.
Amazon-Redshift-Knotentypen
RA3-Knoten mit verwaltetem Speicher ermöglichen die Optimierung Ihres Data Warehouse durch unabhängige Skalierung und Zahlung für Rechen- und Speicherkapazitäten. Mit RA3 wählen Sie die Anzahl der Knoten auf Grundlage der Leistungsanforderungen aus und zahlen nur für den tatsächlich genutzten verwalteten Speicher. Sie sollten Ihren RA3-Cluster anhand der Datenmenge dimensionieren, die Sie täglich verarbeiten.
Redshift Managed Storage (RMS) nutzt große, leistungsstarke SSDs in jedem RA3-Knoten für schnelle lokale Speicherung und Amazon Simple Storage Service (Amazon S3) für längerfristige dauerhafte Speicherung. Wenn die Daten in einem Knoten die Größe der lokalen SSDs überschreiten, lagert RMS diese Daten automatisch an Amazon S3 aus. Für RMS gilt immer der gleiche niedrige Preis – unabhängig davon, ob sich die Daten auf leistungsstarken SSDs oder in Amazon S3 befinden. Für Workloads, die ständig wachsenden Speicherplatz erfordern, können Sie Ihre Data-Warehouse-Speicherkapazität mit RMS automatisch skalieren, ohne zusätzliche Knoten hinzufügen und bezahlen zu müssen.
DC2-Knoten empfehlen sich für rechenintensive Data Warehouses mit lokalem inbegriffenen SSD-Speicher. Hier können Sie die Anzahl der benötigten Knoten auf Grundlage Ihres Datenvolumens und Ihrer Leistungsanforderungen auswählen. DC2-Knoten speichern Ihre Daten für eine möglichst hohe Leistung lokal. Bei steigendem Datenvolumen können Sie weitere Rechenknoten hinzufügen, um die Speicherkapazität des Clusters zu erhöhen. Bei Datensätzen unter nicht komprimierten 1 TB empfehlen sich DC2-Knoten für eine optimale Leistung zum günstigsten Preis. Sollten Sie von einem Anstieg des Datenvolumens ausgehen, empfehlen wir die Verwendung von RA3-Knoten, damit Sie die Rechenleistung und Speicherkapazität unabhängig voneinander skalieren können, um den besten Preis und die beste Leistung zu erzielen.
Redshift-Funktionen mit nutzungsbasierten Preisen
- Amazon-Redshift-Knotentypen: Wählen Sie die beste Clusterkonfiguration und den besten Knotentyp für Ihre Anforderungen aus und nutzen Sie die On-Demand-Preise von Amazon Redshift, um die genutzte Kapazität stundenweise zu bezahlen. Wenn Sie sich für On-Demand-Preise entscheiden, können Sie die Funktion zum Pausieren und Fortsetzen verwenden, um die On-Demand-Abrechnung auszusetzen, wenn ein Cluster nicht verwendet wird. Für stationäre Workloads können Sie statt On-Demand-Instances auch Reserved Instances auswählen und erhebliche Rabatte gegenüber den On-Demand-Preisen in Anspruch nehmen.
- Preise für Amazon Redshift Spectrum: Führen Sie SQL-Abfragen direkt für die Daten in Ihrem Amazon S3 Data Lake aus – bis zu einer Größenordnung von Exabyte. Sie zahlen lediglich für die Menge der gescannten Byte.
- Preise für Nebenläufigkeitsskalierung: Für jeden Cluster erhalten Sie pro Tag bis zu eine Stunde kostenlose Credits für die Nebenläufigkeitsskalierung. Dies ist für 97 % aller Kunden ausreichend. Auf diese Weise können Sie selbst bei Tausenden von gleichzeitigen Abfragen und Benutzern eine konstant hohe Leistung bereitstellen. Sie zahlen einfach einen pro Sekunde abgerechneten On-Demand-Tarif, wenn die Nutzung über die kostenlosen Credits hinausgeht.
- RMS-Preise: Sie zahlen nur für die Daten, die Sie in RA3-Clustern speichern, unabhängig von der Anzahl der bereitgestellten Rechenknoten. Sie zahlen für die Gesamtmenge der in RMS abgelegten Daten lediglich eine stündlich abgerechnete Gebühr. RMS kann auch mit Amazon Redshift Serverless verwendet werden.
- Redshift ML: Nutzen Sie SQL, um Machine Learning (ML)-Modelle zu erstellen, zu trainieren und bereitzustellen. Nachdem Sie das kostenlose Kontingent für Amazon SageMaker aufgebraucht haben, fallen Kosten für die Erstellung Ihres Modells und Speichers an. Redshift ML kann auch mit Amazon Redshift Serverless verwendet werden.
Kostenloses Testprogramm für Amazon Redshift
Wenn Sie Amazon Redshift Serverless nie verwendet haben, haben Sie Anspruch auf ein Guthaben von 300 USD mit einem 90-tägigen Ablaufdatum für Rechen- und Speicherkapazitäten. Die Nutzungsrate dieses Guthabens ist von der tatsächlichen Nutzung und der Rechenkapazität Ihres Serverless Endpunkts abhängig.
In Regionen, in denen Amazon Redshift Serverless noch nicht verfügbar ist, können Kunden eine kostenlose Testversion für bereitgestellte Cluster starten. Sie haben Anspruch auf eine zweimonatige kostenlose Testversion unseres DC2-Large-Knotens. Ihr Unternehmen erhält 750 Stunden pro Monat kostenlos, was für den durchgängigen Betrieb eines DC2-Large-Knotens mit 160 GB komprimiertem SSD-Speicher ausreicht. Sobald Ihre zweimonatige kostenlose Testversion abgelaufen ist oder Ihre Nutzung 750 Stunden pro Monat überschreitet, können Sie Ihren Cluster herunterfahren, um Gebühren zu vermeiden, oder ihn zu unserem standardmäßigen On-Demand-Tarif weiterlaufen lassen. Bitte besuchen Sie die Seite mit der kostenlosen Testversion von Amazon Redshift, um mehr zu erfahren.
On-Demand-Preise
Mit den On-Demand-Preisen von Amazon Redshift haben Sie die Möglichkeit, stundenbasiert für den Knotentyp zu bezahlen, den Sie zur Ausführung Ihres Data Warehouse ausgewählt haben – ohne Verpflichtungen und Vorauszahlungen. Sie zahlen einen stündlichen Tarif, der auf dem ausgewählten Knotentyp und der Anzahl der Knoten in Ihrem Cluster basiert, und die Abrechnung erfolgt nur für die tatsächliche Ausführung des Clusters. Teilweise Stunden werden nach einer abrechenbaren Statusänderung wie dem Erstellen, Löschen, Pausieren oder Fortsetzen des Clusters in Schritten von einer Sekunde abgerechnet. Mit der Funktion zum Pausieren und Fortsetzen können Sie die On-Demand-Abrechnung einfach aussetzen, wenn der Cluster nicht genutzt wird. Die Funktion ist eine manuelle oder geplante Operation für Redshift-Knotentypen. Wenn ein Cluster pausiert wurde, zahlen Sie nur für den Backupspeicher. So müssen Sie Data-Warehouse-Kapazitäten nicht planen und kaufen, bevor Sie sie tatsächlich benötigen. Das ermöglicht Ihnen, Entwicklungs- und Testumgebungen kostengünstig zu verwalten. Für eine Multi-AZ-Bereitstellung zahlen Sie dieselben Abrechnungssätze, jedoch für die doppelte Rechenleistung wie für eine Einzel-AZ-Bereitstellung.
Aktuelle Generation
*Aufrufbare Gesamtspeicherkapazität im verwalteten Speicher pro RA3-Knoten.
Vorherige Generation
Berechnung des effektiven On-Demand-Preises pro TB pro Jahr
Bei On-Demand ist der effektive Preis pro TB und Jahr der Stundenpreis für die Instance mal der Anzahl der Stunden in einem Jahr geteilt durch die Anzahl der TB pro Instance. Bei RA3 werden die im verwalteten Speicher abgelegten Daten separat auf Basis der tatsächlich auf den RA3-Knoten gespeicherten Daten abgerechnet. Der effektive Preis pro TB pro Jahr wird nur für die Kosten der Rechenknoten berechnet.
Amazon Redshift Serverless
Sie können Amazon Redshift Serverless für nur 3 USD pro Stunde nutzen und zahlen nur für die Rechenkapazität, die Ihr Data Warehouse verbraucht, wenn es aktiv ist. Die Data Warehouse-Kapazität wird je nach den Anforderungen Ihrer Analyse-Workload nach oben oder unten skaliert und bei Inaktivität wird die Kapazität nicht in Anspruch genommen. So sparen Sie Verwaltungsaufwand und -kosten. Amazon Redshift misst die Data-Warehouse-Kapazität in RPUs: Redshift Processing Units. Die ausgeführten Workloads zahlen Sie sekundenbasiert (mit einer 60-Sekunden-Mindestgebühr) in RPU-Stunden, einschließlich Abfragen, die Daten in offenen Dateiformaten in Amazon S3 abrufen. Die Zeit bis zum Hochfahren des Data Warehouse wird nicht berechnet. Automatische Skalierung und umfassende Sicherheitsfunktionen sind inbegriffen. Sie müssen für Gleichzeitigkeitsskalierung und Redshift Spectrum nicht separat bezahlen, da beide in Amazon Redshift Serverless enthalten sind.
Sie können optional die Einstellungen Base, Max RPU-Hours und MaxRPU (maximale Kapazität) verwenden, um die Leistung und Kosten des Data Warehouse zu kontrollieren.
- Basis – Mit dieser Einstellung können Sie die grundlegende Data-Warehouse-Kapazität festlegen, die Amazon Redshift für die Verarbeitung von Abfragen nutzt. Die Basiskapazität ist in RPUs angegeben. Eine höhere grundlegende Rechenkapazität kann die Abfrageleistung erhöhen, insbesondere für die Datenverarbeitung und für ETL-Aufträge (Extrahieren, Transformieren, Laden), bei denen große Datenmengen verarbeitet, Transformationen durchgeführt und Daten angereichert werden. Sie können die Einstellung in 8er-Schritten von 8 RPUs auf bis zu 512 RPUs (8, 16, 24, 32, 40, 48 usw. bis hin zu 512) erhöhen. Dazu können Sie die Amazon-Redshift-Managementkonsole verwenden oder eine Amazon-Redshift-API aufrufen.
- Maximal – Mit dieser Einstellung können Sie Nutzungslimits festlegen und Aktionen definieren, die Amazon Redshift beim Erreichen der Limits automatisch ausführen soll, um Ihr Budget vorhersehbar zu halten. „Maximal“ ist in RPU-Stunden angegeben und mit einer täglichen, wöchentlichen oder monatlichen Dauer verbunden. Eine höhere maximale Rechenkapazität kann den allgemeinen Durchsatz des Systems verbessern, was vor allem für Workloads von Vorteil ist, die eine hohe Nebenläufigkeit verarbeiten und gleichzeitig für konsistente hohe Leistung sorgen müssen. Sie können den Max-Wert über die Amazon-Redshift-Verwaltungskonsole oder durch Aufrufen einer Amazon-Redshift-API anpassen.
- MaxRPU (Max Capacity) - Diese Einstellung legt die höchste Anzahl von RPUs fest, die Amazon Redshift Serverless zu Skalierungszwecken aufnehmen kann. Wenn eine automatische Rechenskalierung erforderlich ist, kann ein höherer Wert für MaxRPU den Abfragedurchsatz erhöhen. Wenn das MaxRPU-Limit erreicht ist, skaliert die Arbeitsgruppen-Berechnung die Ressourcen nicht weiter.
Die primäre Speicherkapazität wird als Redshift Managed Storage (RMS) abgerechnet, und der für Benutzer-Snapshots verwendete Speicher wird zu den auf dieser Seite beschriebenen Standardtarifen für die Abrechnung von Backups berechnet. Speicher wird zu denselben Tarifen berechnet wie von Amazon Redshift bereitgestellte Cluster. Mit Amazon Redshift Serverless können Sie Ihr Data Warehouse mit einer Genauigkeit von 30 Minuten kostenlos auf spezifische Wiederherstellungspunkte aus den letzten 24 Stunden zurücksetzen. Datenübertragungskosten und ML-Kosten werden wie bei bereitgestellten Clustern separat verrechnet. Snapshot-Replikation und Datenfreigabe über AWS-Regionen werden zu den auf dieser Seite aufgeführten Preisen berechnet.
Verwalteter Amazon-Redshift-Speicher – Preise
Für die im verwalteten Speicher abgelegten Daten zahlen Sie pro GB einen festen regionsabhängigen monatlichen Tarif. Verwalteter Speicher wird ausschließlich mit RA3-Knotentypen geliefert, und Sie zahlen unabhängig von der Datengröße den gleichen niedrigen Preis für von Redshift verwalteten Speicher. Die Nutzung des verwalteten Speichers wird stündlich nach der im verwalteten Speicher abgelegten Gesamtdatenmenge abgerechnet (sehen Sie sich hierzu auch die nachfolgende Preisberechnung an, in dem die Nutzung in GB-Stunden in Gebühren in GB-Monaten umgerechnet wird). Die Menge der Daten in Ihrem RA3-Cluster können Sie in Amazon CloudWatch oder der AWS-Managementkonsole überwachen. Für Datenübertragungen zwischen RA3-Knoten und dem verwalteten Speicher fallen keine Gebühren an. Die Gebühren für verwalteten Speicher beinhalten keinen Backup-Speicher für automatische oder manuelle Snapshots (siehe Sicherungsspeicher). Auch nach Beendigung des Clusters werden Ihnen noch die Gebühren für die Aufbewahrung Ihrer manuellen Backups in Rechnung gestellt.
Preisbeispiel für verwalteten Speicher
Dies rechnen wir nun in GB-Monate um: 36 900 000 GB-Stunden / 720 Stunden im April = 51 250 GB-Monate.
Amazon Redshift Spectrum – Preise
Mit Amazon Redshift Spectrum können Sie direkte SQL-Abfragen für Datenvolumen im Exabyte-Bereich in Amazon S3 ausführen. Die Gebühren berechnen sich aus dem Volumen der von Redshift Spectrum gescannten Byte, gerundet auf das nächsthöhere Megabyte, wobei pro Abfrage mindestens 10 MB berechnet werden. Für Data Definition Language (DDL)-Anweisungen wie CREATE/ALTER/DROP TABLE zum Verwalten von Partitionen und fehlgeschlagenen Abfragen fallen keine Gebühren an.
Amazon Redshift Serverless-Abfragen externer Daten in Amazon S3 werden nicht separat abgerechnet und sind im Betrag enthalten, der für Amazon Redshift Serverless in RPU-Stunden berechnet wird.
Sie können die Abfrageleistung verbessern und die Kosten senken, indem Sie Daten in einem komprimierten, partitionierten und spaltenbasierten Datenformat speichern. Wenn Sie Daten in einem von Redshift Spectrum unterstützten Format komprimieren, können Sie Ihre Kosten senken, da weniger Daten gescannt werden. Den gleichen Effekt können Sie erzielen, wenn Sie Daten in einem spaltenbasierten Format wie Apache Parquet oder Optimized Row Columnar (ORC) speichern, da Redshift Spectrum nur die für die Abfrage erforderlichen Spalten scannt.
Die Abrechnung bei Redshift Spectrum erfolgt pro Terabyte gescannter Daten, wobei auf das nächsthöhere Megabyte aufgerundet wird. Die Mindestmenge pro Abfrage beträgt 10 MB. Für ein gescanntes Datenvolumen von 10 GB werden beispielsweise 0,05 USD berechnet. Für 1 TB werden 5,00 USD berechnet.
Weitere Kosten
Zusätzlich fallen Gebühren für das Amazon Redshift-Cluster an, das zur Datenabfrage mit Redshift Spectrum verwendet wird. Mit Redshift Spectrum erfolgt die Datenabfrage direkt in Amazon S3. Die Speicherung von Objekten in S3-Buckets und Abfragen an diesen Buckets werden nach S3-Standardtarifen abgerechnet. Weitere Details finden Sie unter Amazon S3-Tarife.
Wenn Sie den AWS Glue-Datenkatalog mit Amazon Redshift Spectrum verwenden, werden die Standardtarife des AWS Glue-Datenkatalogs berechnet. Weitere Details finden Sie unter Preise für AWS Glue.
Wenn Sie Amazon Redshift Spectrum verwenden, um verschlüsselte AWS Key Management Service (KMS)-Daten in Amazon S3 abzufragen, werden Ihnen die Standardpreise von AWS KMS berechnet. Weitere Details finden Sie unter Preise für AWS KMS.
Redshift-Spectrum-Preisbeispiele basieren auf den geltenden Preisen der Region USA Ost (Nord-Virginia)
Angenommen, Sie haben eine Tabelle mit 100 Spalten gleicher Größe, die in Amazon S3 als unkomprimierte Textdatei mit einer Gesamtgröße von 4 TB gespeichert ist. Für eine Abfrage der Daten aus einer einzigen Spalte muss Redshift Spectrum die gesamte Datei durchsuchen, da Textformate nicht teilbar sind. Diese Abfrage würde 4 TB Daten scannen und 20 USD kosten (5 USD/TB x 4 TB = 20 USD).
Wenn Sie diese Datei mit GZIP komprimieren, kann die Komprimierungsrate 4:1 betragen. In diesem Fall hätten Sie eine Datei, die einer komprimierten Dateigröße von 1 TB entspricht. Redshift Spectrum muss zwar immer noch die gesamte Datei scannen, da diese aber auf ein Viertel der Größe komprimiert wurde, zahlen Sie nur ein Viertel der Kosten, also 5 USD (5 USD/TB x 1 TB = 5 USD).
Wenn Sie die Datei komprimieren und in ein spaltenbasiertes Format wie Apache Parquet konvertieren, können Sie eine Komprimierungsrate von 4:1 erzielen und erhalten somit eine komprimierte Dateigröße von 1 TB. Mit der obigen Abfrage muss Redshift Spectrum in der Parquet-Datei nur eine Spalte scannen. Die Kosten dieser Abfrage würden sich auf 0,05 USD belaufen (5 USD/TB x 1 TB Dateigröße x 1/100 Spalten oder insgesamt 10 GB gescannt = 0,05 USD).
Hinweis: Diese Preisbeispiele dienen nur zur Veranschaulichung. Die Komprimierungsraten von anderen Dateien und Spalten können abweichen.
Nebenläufigkeitsskalierung – Preise
Amazon Redshift bietet jetzt automatisch vorübergehende Kapazitäten, um kontinuierlich schnelle Leistung zu bieten, selbst bei Tausenden von gleichzeitigen Benutzern und Abfragen. Sie müssen keine Ressourcen verwalten, keine Vorauszahlungen leisten und Ihnen werden für vorübergehende Cluster keine Start- oder Stillstandszeiten berechnet. Wenn Ihr Hauptcluster ausgeführt wird, können Sie alle 24 Stunden eine Stunde Cluster-Credits für Nebenläufigkeitsskalierung ansammeln. Sie zahlen einen On-Demand-Tarif pro Sekunde für Cluster, die im Rahmen der Nebenläufigkeitsskalierung über die kostenlosen Credits hinaus benötigt werden – jedoch nur wenn Ihre Abfragen verarbeitet werden – wobei Ihnen für jede Aktivierung eines Clusters für die Nebenläufigkeitsskalierung eine Mindestgebühr von einer Minute berechnet wird. Der On-Demand-Tarif pro Sekunde basiert auf der Art und Anzahl der Knoten Ihres Amazon-Redshift-Clusters.
Mit Amazon Redshift Serverless werden Ressourcen standardmäßig automatisch gemäß den Workload-Anforderungen skaliert. Für die Nebenläufigkeitsskalierung fallen dabei keine separaten Kosten an.
Guthaben für Nebenläufigkeitsskalierung
Redshift Cluster verdienen pro Tag bis zu einer Stunde an kostenlosen Credits für die Nebenläufigkeitsskalierung. Credits werden auf Stundenbasis für jedes aktive Cluster in Ihrem AWS-Konto erworben und können nur nach Erwerb durch das gleiche Cluster genutzt werden. Sie können für jedes aktive Cluster bis zu 30 Stunden an kostenlosen Credits für die Nebenläufigkeitsskalierung sammeln. Credits verfallen nicht, solange wie Ihr Cluster nicht gelöscht wird.
Preisbeispiel für Nebenläufigkeitsskalierung
Ein Redshift Cluster mit 10 DC2.8XL-Knoten in der Region USA-Ost kostet 48 USD pro Stunde. Folgendes Szenario: Die Nutzung zweier vorübergehender Cluster übersteigt die kostenlosen Credits für die Nebenläufigkeitsskalierung um je 5 Minuten. Der On-Demand-Tarif pro Sekunde für die Nebenläufigkeitsskalierung beträgt 48 USD x 1/3 600 = 0,013 USD pro Sekunde. Die zusätzlichen Kosten für die Nebenläufigkeitsskalierung in diesem Beispiel betragen 0,013 USD pro Sekunde x 300 Sekunden x 2 vorübergehende Cluster = 8 USD. Die Gesamtkosten für den Amazon-Redshift-Cluster und die zwei vorübergehenden Cluster belaufen sich in diesem Fall auf 56 USD.
Redshift ML – Preise
Wenn Sie mit Redshift ML anfangen, sind Sie für das kostenlose Kontingent von Amazon SageMaker qualifiziert, sofern Sie Amazon SageMaker nicht schon einmal genutzt haben. Es umfasst zwei kostenlose CREATE MODEL-Anfragen im Monat für eine Dauer von zwei Monaten mit bis zu 100.000 Zellen pro Anfrage. Ihr kostenloses Kontingent startet mit dem ersten Monat, nachdem Sie Ihr erstes Modell in Redshift ML erstellt haben.
Amazon-S3-Gebühren
Für die CREATE MODEL-Anforderung fallen auch geringe Amazon-S3-Kosten an. Die S3-Kosten sollten bei unter 1 USD pro Monat liegen, da die Menge der von CREATE MODEL generierten S3-Daten nur wenige GB umfassen. Wenn Garbage Collection aktiviert ist, werden sie schnell entfernt. Amazon S3 wird zunächst verwendet, um die von der SELECT-Abfrage von CREATE MODEL produzierten Trainingsdaten zu speichern. Dann wird es verwendet, um verschiedene modellverbundene Artefakte zu speichern, die für die Vorhersage erforderlich sind. Im Standardmodus von Garbage Collection werden sowohl Trainingsdaten als auch modellverbundene Artefakte am Ende von CREATE MODEL entfernt.
Optionen zur Kostenkontrolle
Sie können die Trainingskosten kontrollieren, indem Sie MAX_CELLS einrichten. Wenn Sie das nicht tun, liegt der Standardwert von MAX_CELLs bei 1 Million, womit Ihre Trainingskosten in den meisten Fällen bei unter 20 USD liegen sollten. Wenn der Trainingsdatensatz 1 Million übersteigt, erhöhen sich die Preise folgendermaßen:
Anzahl der Zellen | Preis |
Ersten 10 Mio. Zellen |
20 USD pro 1 Million Zellen |
Nächsten 90 Mio. Zellen |
15 USD pro 1 Million Zellen |
Über 100 Mio. Zellen |
7 USD pro 1 Million Zellen |
Hinweis: Die tatsächlichen Preise sind häufig niedriger als die oben angegebenen oberen Grenzen.
CREATE MODEL-Beispielkosten:
- 100,000 Zellen sind 20 USD (= 1 x 20)
- 2 000 000 Zellen sind 40 USD (= 2 x 20)
- 23,000,000 Zellen sind 395 USD (=10 x 20 + 13 x 15)
- 99 000 000 Zellen sind 1 535 USD (= 10 x 20 x 89 x 15) und
- 211 Mio. Zellen sind 2 327 USD (= 10 x 20 + 90 x 15 + 111 x 7)
Wenn die von der SELECT-Abfrage des CREATE MODEL produzierten Trainingsdaten das von Ihnen eingestellte MAX_CELLS-Limit (oder das Standardlimit von 1 Million, wenn Sie keins angegeben haben) übersteigt, wählt CREATE MODEL eine Anzahl von Einträgen (ungefähr MAX_CELLS / Anzahl der Spalten) zufällig aus dem Trainingsdatensatz aus und trainiert mit diesen zufällig ausgewählten Tupeln. Mit der zufälligen Auswahl sollen Verzerrungen in dem reduzierten Trainingsdatensatz verhindert werden. Daher können Sie durch Einstellung der MAX_CELLS dafür sorgen, dass sich Ihre Kosten im Rahmen halten.
Reserved Instances – Preise
Reserved Instances eignen sich für kontinuierliche Produktions-Workloads und bieten erhebliche Einsparungen gegenüber On-Demand-Preisen von Amazon-Redshift-Knotentypen. In der Regel werden Reserved Instances erst nach der erfolgreichen Durchführung von Experimenten und Machbarkeitstests zur Überprüfung von Produktionskonfigurationen gekauft.
Sie können von erheblichen Einsparungen gegenüber On-Demand-Tarifen profitieren, wenn Sie sich verpflichten, Amazon Redshift für eine ein- oder dreijährige Laufzeit zu nutzen. Die Preise für Reserved Instances sind vom erworbenen Knotentyp abhängig und gelten bis zum Ablauf des Reservierungszeitraums. Die Preise enthalten zwei zusätzliche Datenkopien, eine auf den Clusterknoten und eine in Amazon S3. Wir kümmern uns um Backup, Beständigkeit, Verfügbarkeit, Sicherheit, Überwachung und Wartung.
Bei Reserved Instances können Sie zwischen drei Preisoptionen wählen:
Keine Vorauszahlung – Sie leisten keine Vorauszahlung und verpflichten sich über ein Jahr zu einer monatlichen Zahlungsweise.
Teilweise Vorauszahlung – Sie zahlen einen Teil der Reserved Instance im Voraus und den Rest über eine Laufzeit von einem oder drei Jahren.
Komplette Vorauszahlung – Sie zahlen die gesamte Reserved Instance für eine Laufzeit von einem oder drei Jahren im Voraus.
Reserved Instances sind ein Abrechnungskonzept und werden nicht zur Erstellung von Data-Warehouse-Clustern verwendet. Wenn Sie einen Kauf tätigen, werden Ihnen die damit verbundenen Voraus- und Monatsgebühren in Rechnung gestellt, auch wenn Sie derzeit keinen Cluster betreiben oder wenn ein bestehender Cluster angehalten wird. Zum Kauf von Reserved Instances navigieren Sie in der Redshift-Konsole zur Registerkarte „Reservierte Knoten“.
Wir können das Preisprogramm der Reserved Instances jederzeit beenden. Reserved Instances unterliegen zusätzlich zu den Reserved Instance-Preisen auch allen Datenübertragungs- oder anderen Gebühren, die gemäß dem AWS Kundenvertrag oder einer anderen Vereinbarung mit uns, die Ihre Nutzung unserer Dienste regelt, anfallen.
*Dies ist die monatliche Durchschnittszahlung über die gesamte Reserved-Instance-Laufzeit. Für jeden Monat entspricht die tatsächliche monatliche Zahlung der tatsächlichen Anzahl der Stunden in diesem Monat multipliziert mit der stündlichen Nutzungsrate oder der Anzahl der Sekunden in diesem Monat multipliziert mit der stündlichen Nutzungsrate geteilt durch 3 600, abhängig vom Redshift-Instancetyp, den Sie betreiben. Die Nutzungsgebühr pro Stunde entspricht den gesamten durchschnittlichen Monatszahlungen über die gesamte Reserved-Instance-Laufzeit dividiert durch die Gesamtanzahl von Stunden (basierend auf einem Jahr mit 365 Tagen) über die gesamte Reserved-Instance-Laufzeit.
**Gezeigt wird die tatsächliche Stundengebühr, um Ihnen beim Berechnen des Betrags, den Sie bei einer Reserved Instance im Vergleich zu einer On-Demand-Instance einsparen, zu helfen. Wenn Sie eine Reserved Instance kaufen, wird Ihnen jede Stunde während der gesamten Reserved-Instance-Laufzeit, die Sie gewählt haben, in Rechnung gestellt, unabhängig davon, ob die Instance in Betrieb ist. Der effektive Stundenpreis zeigt die amortisierten stündlichen Instance-Kosten. Dabei werden die Gesamtkosten der Reserved Instance über die gesamte Laufzeit, einschließlich einer eventuellen Vorauszahlung, auf jede Stunde der Reserved-Instance-Laufzeit verteilt.
*** Bei Reserved Instances multiplizieren Sie den Stundensatz mit der Anzahl der Stunden innerhalb der Laufzeit, addieren das Ergebnis zur Vorauszahlung und teilen diese Zahl durch die Anzahl der Jahre der Laufzeit und die Menge der TB pro Knoten. Bei RA3 werden die im verwalteten Speicher abgelegten Daten separat auf Basis der tatsächlich auf den RA3-Knoten gespeicherten Daten abgerechnet. Der effektive Preis pro TB und Jahr wird nur für die Kosten der Computing-Knoten berechnet.
Null-ETL-Integrationskosten NEU
Amazon Redshift verfügt über Null-ETL-Integrationen mit OLTP-Datenbanken, sodass keine ETL-Pipelines erstellt und verwaltet werden müssen. Zu den unterstützten Datenbanken gehören Amazon Aurora, Amazon DynamoDB und Amazon Relational Database Service (Amazon RDS) für MySQL. Diese Integrationen bieten Ihnen Flexibilität, sodass Sie bestimmte Datentabellen in einer Datenbank auswählen können, die automatisch nach Amazon Redshift repliziert werden sollen. Diese Flexibilität ermöglicht es Ihnen, einheitliche Analytik für mehrere Anwendungen und Datenquellen durchzuführen. AWS erhebt keine zusätzliche Gebühr für die Null-ETL-Integration. Sie zahlen für vorhandene Ressourcen, die zur Erstellung und Verarbeitung der im Rahmen einer Null-ETL-Integration erstellten Änderungsdaten verwendet werden. Dazu gehören zusätzlicher Amazon-Redshift-Speicher zum Speichern replizierter Daten, Rechenleistung für die Verarbeitung der Datenreplikation (oder RPUs in Amazon Redshift Serverless) und AZ-übergreifende Datenübertragungskosten für die Übertragung von Daten von der Quelle zum Ziel. Die fortlaufende Verarbeitung von Datenänderungen durch die Null-ETL-Integration wird ohne zusätzliche Kosten angeboten. Weitere Informationen finden Sie auf den Preisseiten für Aurora, RDS für MySQL und DynamoDB.
Backup-Speicher
Sicherungsspeicher sind die mit Snapshots verbundene Speicherung für Ihr Data Warehouse. Wenn Sie die Aufbewahrungszeit Ihrer Backups erhöhen oder zusätzliche Snapshots erstellen, belegt Ihr Data Warehouse entsprechend mehr Backupspeicher. Für manuelle Snapshots, die Sie mit der Konsole, der Anwendungsprogrammierschnittstelle (API) oder der Befehlszeilenschnittstelle (CLI) aufnehmen, fallen in Amazon Redshift Kosten an. Automatisierte Redshift-Snapshots, die standardmäßig mit der Snapshot-Planungsfunktion von Amazon Redshift erstellt werden, sind kostenlos und können für bis zu 35 Tage aufbewahrt werden. Für Amazon Redshift Serverless-Wiederherstellungspunkte, die weniger als 24 Stunden alt sind, fallen keine Kosten an. Wenn Sie Wiederherstellungspunkte länger als 24 Stunden aufbewahren, werden sie als Teil von RMS berechnet. Auf RA3-Clustern gespeicherte Daten sind Teil von RMS und werden zu RMS-Tarifen abgerechnet. Manuelle Snapshots, die für RA3-Cluster erstellt werden, werden jedoch als Backupspeicher zu den üblichen Amazon-S3-Tarifen abgerechnet, die auf dieser Seite beschrieben werden.
Wenn Ihr RA3-Cluster beispielsweise 10 TB Daten und 30 TB manuelle Snapshots enthält, werden Ihnen 10 TB RMS und 30 TB Backupspeicher in Rechnung gestellt. Bei Dense-Compute-Clustern (DC) und Dense-Speicher-Clustern (DS) ist der Speicher auf dem Cluster enthalten und wird nicht separat berechnet, aber Backups werden extern in Amazon S3 gespeichert. Backupspeicher, der über die bereitgestellte Speichergröße auf DC- und DS-Clustern hinausgeht, wird als Backupspeicher zu den üblichen S3-Tarifen abgerechnet. Snapshots werden so lange in Rechnung gestellt, bis sie ablaufen oder gelöscht werden, auch wenn der Cluster angehalten oder gelöscht wird.
Datenübertragung
Für Daten, die innerhalb der gleichen AWS-Region zur Sicherung und Wiederherstellung bzw. zum Speichern und Wiederabrufen zwischen Amazon Redshift und Amazon S3 übertragen werden, wird keine Gebühr erhoben. Für alle anderen Datenübertragungen in und aus Amazon Redshift werden Ihnen die standardmäßigen AWS-Datenübertragungspreise in Rechnung gestellt. Insbesondere gelten bei Ausführung Ihres Amazon-Redshift-Clusters in Amazon Virtual Private Cloud (VPC) die AWS-Standardtarife für Datenübertragungen über JDBC/ODBC an Ihren Amazon-Redshift-Cluster-Endpunkt. Wenn Sie Enhanced VPC Routing verwenden und Daten zu Amazon S3 in einer anderen Region entladen, fallen außerdem die standardmäßigen AWS-Datenübertragungsgebühren an. Weitere Informationen zu AWS-Datenübertragungstarifen finden Sie in der Preisübersicht zu Amazon Elastic Cloud Compute (Amazon EC2).
In Amazon Redshift fallen Gebühren für die regionsübergreifende Nutzung von Daten und für regionsübergreifende Snapshot-Kopien an. Gebühren für die gemeinsame Nutzung von Daten werden in der Verbraucherregion berechnet, in der die Daten abgerufen werden. Gebühren für regionsübergreifende Snapshot-Kopien werden in der Quellregion berechnet, in der sich der Cluster befindet, auf dem der Snapshot erstellt wurde. Datenübertragungsgebühren fallen für alle Snapshots (sowohl automatische als auch manuelle) und Wiederherstellungspunkte an. Alle Datenübertragungsgebühren für das Snapshot-Kopieren gelten nur für inkrementelle Daten.
Datenübertragung durch Datenfreigabe IN oder Datenübertragung einer Snapshot-Kopie AUS
Preisbeispiele
Sie verwenden einen Monat lang vier ra3.xlarge-Knoten und 40 TB RMS. Im Laufe des Monats scannen Sie außerdem 20 TB Daten mit Redshift Spectrum und scannen 20 TB Daten. Sie verwenden On-Demand-Preise.
Die Gebühren dafür werden wie folgt berechnet:
- Kosten für Redshift RA3-Instance = 4 Instances x 3,26 USD pro Stunde x 730 Stunden pro Monat = 9 519,20 USD
- RMS-Kosten = 40 TB x 1.024 GB pro TB x 0,024 USD = 983,04 USD
- Kosten für Redshift Spectrum = 20 TB x 5,00 USD = 100,00 USD
Monatliche Gesamtkosten: 10 602,24 USD
Sie verwenden einen Multi-AZ-Cluster, der gleichzeitig in zwei AZs bereitgestellt wird. Ihr Cluster verfügt über vier ra3.4xlarge-Knoten pro AZ und Sie nutzen 40 TB RMS für einen Monat. Sie verwenden On-Demand-Preise.
Ihre Gebühren dafür werden wie folgt berechnet:
- Kosten für Redshift-RA3-Instance für AZ1 = 4 Instances x 3,26 USD pro Stunde x 730 Stunden pro Monat = 9 519,20 USD
- Kosten für Redshift RA3-Instance für AZ2 = 4 Instances x 3,26 USD pro Stunde x 730 Stunden pro Monat = 9 519,20 USD
- RMS-Kosten = 40 TB x 1 024 GB pro TB x 0,024 USD = 983,04 USD
Monatliche Gesamtkosten: 20 021,44 USD
Angenommen, Sie haben einen Datenverarbeitungsauftrag, der in Ihrem Amazon-Redshift-Data-Warehouse in der Region USA Ost (Nord-Virginia) zwischen 7 Uhr und 19 Uhr einmal pro Stunde ausgeführt werden muss. Der Einfachheit halber gehen wir davon aus, dass die Dauer der Auftragsausführung immer gleich ist: 10 Minuten und 30 Sekunden. Amazon Redshift nutzt eine Kapazität von 128 RPUs, um den Auftrag auszuführen.
Die folgende Tabelle fasst die Gesamtnutzung für den Tag zusammen.
Abfragezeitraum |
Der Auftrag wurde zwischen 7 Uhr und 19 Uhr 13-mal ausgeführt und dauerte jeweils 10 Minuten und 30 Sekunden = 136 Minuten und 30 Sekunden = 8190 Sekunden |
Genutzte Kapazität |
128 RPU |
Tägliche Gebühren |
109,20 USD ((8190 x 128 RPU x 0,375 USD pro RPU-Stunde) / 3600) |
Angenommen, Sie führen in Ihrem Amazon-Redshift-Data-Warehouse in der Region USA Ost (Nord-Virginia) eine Dashboarding-Anwendung aus. Die Anwendung wird von verschiedenen Benutzern innerhalb der Organisation genutzt (z. B. Datenanalysten, Entwicklern und Datenwissenschaftlern) und die Zugriffszahlen variieren je nach Tageszeit. Insbesondere zwischen 9 Uhr und 11 Uhr sowie zwischen 14 Uhr und 16 Uhr, wenn die meisten Benutzer Analysen durchführen und Daten aus dem Data Warehouse abrufen, werden hohe Aktivitätszahlen verzeichnet. Es gibt vier Intervalle von je 15 Minuten zwischen 11 Uhr und 14 Uhr, in denen kein Benutzer auf die Anwendung zugreift. Auch zwischen 22 Uhr und 5 Uhr morgens gibt es keine Benutzeraktivitäten.
Jetzt sehen wir uns die Ressourcennutzung im Amazon-Redshift-Data-Warehouse an. Für eine bessere Kontrolle über das Preis-Leistungs-Verhältnis haben Sie die Basiskonfiguration von Amazon Redshift Serverless auf 64 RPU eingestellt. In den Spitzenzeiten am Morgen und am Nachmittag führt Amazon Redshift eine automatische Skalierung aus und nutzt Kapazitäten von insgesamt 192 bzw. 128 RPU.
Die folgende Tabelle fasst die Gesamtnutzung für den Tag zusammen.
Zeitrahmen |
Zeitraum der Abfrageausführung gesamt |
5 Uhr bis 9 Uhr |
64 RPU für 4 Stunden = 64 x 4 = 256 RPU-Stunden |
9 Uhr bis 11 Uhr |
192 RPU für 2 Stunden = 384 RPU-Stunden |
11 Uhr bis 14 Uhr |
Mit Ausnahme der vier 15-Minuten-Intervalle ohne Aktivitäten beläuft sich die Aktivitätszeit auf 2 Stunden. 64 RPU für 2 Stunden = 64 x 2 = 128 RPU-Stunden |
14 Uhr bis 15 Uhr |
128 RPU für 1 Stunde = 128 RPU-Stunden |
15 Uhr bis 22 Uhr |
64 RPU für 7 Stunden = 64 x 7 = 448 RPU-Stunden |
22 Uhr bis 5 Uhr |
Keine Aktivität |
Tägliche Gebühren |
504 USD ((256 + 384 + 128 + 128 + 448) x 0,375 USD pro RPU-Stunde) |
Ein Redshift Cluster mit 10 DC2.8XL-Knoten in der Region USA-Ost kostet 48 USD pro Stunde. Folgendes Szenario: Die Nutzung zweier vorübergehender Cluster übersteigt die kostenlosen Credits für die Nebenläufigkeitsskalierung um je 5 Minuten. Der On-Demand-Tarif pro Sekunde für die Nebenläufigkeitsskalierung beträgt 48 USD x 1 / 3 600 = 0,013 USD pro Sekunde. Die zusätzlichen Kosten für die Nebenläufigkeitsskalierung in diesem Beispiel betragen 0,013 USD pro Sekunde x 300 Sekunden x 2 vorübergehende Cluster = 8 USD. Die Gesamtkosten für die Redshift-Cluster und die zwei vorübergehenden Cluster belaufen sich in diesem Fall also auf 56 USD.
Angenommen, Sie haben eine Tabelle mit 100 Spalten gleicher Größe, die in Amazon S3 als unkomprimierte Textdatei mit einer Gesamtgröße von 4 TB gespeichert ist. Für eine Abfrage der Daten aus einer einzigen Spalte muss Redshift Spectrum die gesamte Datei durchsuchen, da Textformate nicht teilbar sind. Basierend auf den Redshift-Spectrum-Preisen für die Region USA Ost (Nord-Virginia), würde diese Abfrage 4 TB scannen und 20 USD kosten (5,00 USD/TB x 4 TB = 20 USD).
Wenn Sie diese Datei mit GZIP komprimieren, kann die Komprimierungsrate 4:1 betragen. In diesem Fall hätten Sie eine Datei, die einer komprimierten Dateigröße von 1 TB entspricht. Redshift Spectrum muss zwar immer noch die gesamte Datei scannen, da diese aber auf ein Viertel der Größe komprimiert wurde, zahlen Sie nur ein Viertel der Kosten, also 5 USD (5 USD/TB x 1 TB = 5 USD).
Wenn Sie die Datei komprimieren und in ein spaltenbasiertes Format wie Apache Parquet konvertieren, können Sie eine Komprimierungsrate von 4:1 erzielen und erhalten somit eine komprimierte Dateigröße von 1 TB. Mit der obigen Abfrage muss Redshift Spectrum in der Parquet-Datei nur eine Spalte scannen. Die Kosten dieser Abfrage würden sich auf 0,05 USD belaufen (5 USD/TB x 1 TB Dateigröße x 1/100 Spalten oder insgesamt 10 GB gescannt = 0,05 USD).
Hinweis: Diese Preisbeispiele dienen nur zur Veranschaulichung. Die Komprimierungsraten von anderen Dateien und Spalten können abweichen.
Weitere Ressourcen zur Preiskalkulation
Berechnen Sie Ihre monatlichen Nutzungskosten für AWS auf einfache Art und Weise
Kontaktieren Sie AWS-Spezialisten, um ein personalisiertes Angebot zu erhalten
Entdecken Sie weitere Amazon-Redshift-Ressourcen