今日を知り、明日を変えるシステム運用メディア

Amazon EMR サーバーレスストリーミングジョブが AWS GovCloud (米国) リージョンで利用可能になりました

Amazon EMR サーバーレスストリーミングジョブが AWS GovCloud (米国) リージョンで利用可能になりました

本記事は、2025 年 3 月 14 日にAWS公式サイトの What’s New with AWS? に掲載された英語記事を自動翻訳したものです。

ニュース内容

Amazon EMR Serverless は、Amazon EMR のサーバーレスオプションです。これにより、データエンジニアやデータサイエンティストは、クラスターやサーバーを構成、管理、スケーリングすることなく、オープンソースのビッグデータ分析フレームワークを簡単に実行できます。本日、ストリーミングデータを継続的に分析および処理できる Amazon EMR Serverless Streaming ジョブが、AWS GovCloud (米国) リージョンで利用可能になったことをお知らせします。

ストリーミングは、企業がセンサー、IoT デバイス、Web ログなどのデータソースから継続的に洞察を得るために不可欠になっています。ただし、高可用性、障害に対する回復力、ストリーミングサービスとの統合などの要件により、ストリーミングデータの処理は困難になる可能性があります。Amazon EMR Serverless Streaming ジョブには、これらの課題に対処するための機能が組み込まれています。正常な AZ に自動的にフェイルオーバーすることで、マルチ AZ (アベイラビリティゾーン) の回復力を通じて高可用性を実現します。また、障害時の自動ジョブ再試行や、ログのローテーションや圧縮などのログ管理機能によって回復力が向上し、ジョブの失敗につながる可能性のあるログファイルの蓄積を防ぎます。さらに、Amazon EMR Serverless Streaming ジョブは、セルフマネージド Apache Kafka クラスター、Amazon Managed Streaming for Apache Kafka などのストリーミング サービスからのデータ処理をサポートしており、新しい組み込みの Amazon Kinesis Data Streams コネクタを使用して Amazon Kinesis Data Streams と統合されているため、エンドツーエンドのストリーミング パイプラインの構築が容易になります。

開始するには、Amazon EMR Serverless ユーザーガイドの Amazon EMR Serverless Streaming ジョブ ページにアクセスしてください。

原文

Amazon EMR Serverless is a serverless option in Amazon EMR that makes it simple for data engineers and data scientists to run open-source big data analytics frameworks without configuring, managing, and scaling clusters or servers. Today, we are excited to announce that Amazon EMR Serverless Streaming jobs, which enables you to continuously analyze and process streaming data, is now available in the AWS GovCloud (US) Regions.

Streaming has become vital for businesses to gain continuous insights from data sources like sensors, IoT devices, and web logs. However, processing streaming data can be challenging due to requirements such as high availability, resilience to failures, and integration with streaming services. Amazon EMR Serverless Streaming jobs has built-in features to addresses these challenges. It offers high availability through multi-AZ (Availability Zone) resiliency by automatically failing over to healthy AZs. It also offers increased resiliency through automatic job retries on failures and log management features like log rotation and compaction, preventing the accumulation of log files that might lead to job failures. In addition, Amazon EMR Serverless Streaming jobs support processing data from streaming services like self-managed Apache Kafka clusters, Amazon Managed Streaming for Apache Kafka, and now is integrated with Amazon Kinesis Data Streams using a new built-in Amazon Kinesis Data Streams Connector, making it easier to build end-to-end streaming pipelines.

To get started, visit the Amazon EMR Serverless Streaming jobs page in the Amazon EMR Serverless User Guide.

引用元:Amazon EMR Serverless Streaming jobs is now available in the AWS GovCloud (US) Regions

人気の記事

最新情報をお届けします!

最新のITトレンドやセキュリティ対策の情報を、メルマガでいち早く受け取りませんか?ぜひご登録ください

メルマガ登録