最終更新日:2025.01.10

【データ分析入門】Amazon Redshiftとは? 活用事例や料金体系を紹介!

多くの企業にとってデータの利活用は有益な取り組みですが、企業が保有するデータは膨大で企業内の複数の場所に点在することが多く、十分に活用できていない企業も少なくないのではないでしょうか。また、データ分析には分析基盤の構築が必要であり、運用においてもデータ処理速度やコストの問題が常について回ります。そのようなデータ分析基盤を構築する際に、おすすめしたいサービスがAmazon Redshiftです。今回の記事では、Amazon Redshiftの導入メリットや活用事例、料金体系をご紹介します。

Amazon Redshiftとは

まずはAmazon Redshiftの概要と、他の類似サービスとの違いから解説していきます。

Amazon Redshiftとは

Amazon Redshiftは、AWSが提供するフルマネージド型のクラウドデータウェアハウスサービスです。構造化データや半構造化データを蓄積し、SQLやAIを使ったアーキテクチャを使用して、高速でデータ分析を行えることが特長です。AWS上でデータ分析基盤を構築する際に活用されています。

なお、データ分析基盤については、以下の2記事で詳しく説明しています。興味のある方はあわせてご参照ください。

AWSで実現するデータ分析|AWSが提供しているデータレイク・データウェアハウスツールの活用法

AWSで実現するデータ分析|そもそもデータ分析基盤とは?

他のAWSデータベースサービスとの違い

AWSではAmazon Redshift以外にも、複数のデータベースサービスを提供しています。類似サービスとの違いは以下の通りです。

サービス名 目的 特徴
Amazon Redshift 高度なデータ分析、膨大なデータの処理 列指向のストレージで処理が高速
Amazon RDS オンライントランザクション処理、他データベースの管理 行指向ストレージでデータの一貫性を保持するのが得意
Amazon Aurora オンライントランザクション処理 Amazon RDSのオプションの一つ
読み込み負荷を分散する仕組みを有する
Amazon Athena 膨大なデータの処理 自動でリソース割り当てを行う

Amazon RDS

Amazon RDSはマネージド型リレーショナルデータベースで、AWS上でリレーショナルデータベースを管理するサービスを集めたものです。
Amazon RDSではデータベースの構築やバックアップ、スケールなどの管理作業が比較的簡易に行えます。

データ分析を主とするAmazon Redshiftとは用途が異なり、Amazon RDSはトランザクション処理やその他データベースの管理を行うサービスです。またAmazon Redshiftが列指向であることに対して、Amazon RDSは行指向であるという違いもあります。(列指向については後述します)

RDSについて詳しくは下記記事をご参照ください。

AWS RDSとは? 導入メリット・料金体系・インスタンスタイプなどを紹介

Amazon Aurora

Amazon AuroraはAmazon RDSのサービスのひとつで、トランザクション処理に用いられます。MySQLやPostgreSQLと完全な互換性があり、可用性やセキュリティーの高さが特長です。

Amazon Athena

Amazon Athenaは、サーバーレスで従量課金を採用しているデータ分析サービスです。
Amazon S3と接続ができ、ペタバイト規模のデータ分析を可能としています。

Amazon Redshiftとはデータ分析という用途は同じで、異なるのはリソースの割り当て方です。Amazon Athenaは自動でリソースの割り当てを行います。作業者の手間がかからない反面、負荷が高い場合に処理が遅くなり、コストも比較的高くなる可能性があります。Amazon Redshiftは手動でもリソースを割り当てることが可能で、負荷が高くなったときなどに対処しやすいのが特長です。

Amazon Redshiftを導入するメリット

続いて、Amazon Redshiftを導入するメリットについてご紹介します。主なメリットとしては、以下の3点が挙げられます。

高速でデータ分析を行える

Amazon Redshiftは、データ分析を高速で行うための仕組みを有しています。具体的には、以下のような仕組みで処理の高速化を実現しています。

列指向ストレージ

Amazon Redshiftは、列指向ストレージを採用しています。列指向ストレージとは、列によってデータを管理することで、データを効率よく処理できる設計方法のことです。行ごとにデータの追加・更新・削除を行う「行指向ストレージ」よりも処理速度が上がり、大量のデータの集計および分析に適しています。加えて、データを保存する際に列を圧縮することも可能で、圧縮により処理が高速化されるとともに、ストレージ容量およびコストの削減にもなります。

MPP(Massively Parallel Processing)

Amazon Redshiftでは 、MPP(超並列処理:Massively Parallel Processing)でデータを処理しています。MPPは複数のノードにクエリを分散させて、処理する仕組みです。Amazon Redshiftでは、リーダーノードが受け付けた全クエリを、コンピューティングノードに割り振るという分散処理を行っており、これにより処理の高速化を可能としています。

AWSの他サービスとの連携がスムーズ

データ分析においては、多くの場合単体のサービスだけではなく、データレイクや機械学習など、さまざまなサービスをあわせて活用します。Amazon Redshiftは、他のAWSサービスと連携がしやすいのも大きなメリットのひとつです。Amazon Redshiftと組み合わせて活用されているサービスとしては、以下のようなサービスが挙げられます。

  • AWS Glue:ETL処理(抽出・変換・書き出し)を行うサービス。Amazon Redshiftと連携すればETL処理されたデータを送信できる。
  • Amazon QuickSight:Amazon S3やファイルデータなどのデータソースから分析結果を抜き出し、可視化できるサービス。Amazon Redshiftのデータを可視化し、レポートを作成できる。
  • Amazon SageMaker:機械学習モデルを構築するサービス。Amazon Redshiftに保存したデータで機械学習モデルを構築できる。

ほかにも、Amazon Redshiftでは連携に関するさまざまな機能が用意されています。

  • フェデレーテッドクエリ(横串検索):Amazon RedshiftからAmazon AuroraやAmazon RDSなどの、外部データベースのクエリを実行できる。
  • Amazon Redshift Spectrum:Amazon Redshiftの拡張機能で、Amazon S3に保存されているデータに対してクエリを実行できる。

スケーラビリティが高い

Amazon Redshiftはペタバイト単位の大きなデータを保持でき、管理画面での簡単な操作でスケーリングが可能です。またAmazon Redshift Serverlessを利用すれば、複雑な管理は必要なく、自動的にデータウェアハウスのキャパシティーを判断し、最適なスケーリングを行えます。そのため、利用者はデータ分析に専念することが可能です。

Amazon Redshiftの活用事例

ここからは、Amazon Redshiftを活用している企業の事例を2つご紹介します。

三菱UFJフィナンシャル・グループ(MUFG)

三菱UFJフィナンシャル・グループ(MUFG)は、メガバンクの三菱UFJ銀行を傘下に持ち、国内外のさまざまなビジネス分野で金融サービスを行う企業グループです。経営戦略にDXを掲げており、その第一段階として、AWSを活用して三菱UFJ銀行の各種システムのデータを一元管理する取り組みを進めていました。

三菱UFJ銀行は、従来システムごとにデータを個別で保存していたためにデータ収集が難しく、データを効果的に活用できていないという問題を抱えていました。経営管理システムやリスク管理システムなど、20ほどの情報システムがオンプレミスで稼働しており、蓄積されていたデータも、数年分しかないという状態だったそうです。そこで、データ分析プラットフォームを構築することを決め、データレイクはAmazon S3、データウェアハウスにAmazon Redshiftを採用しました。

その結果、約4,000万件の顧客口座情報や、過去10年分の取引明細などの構造化データと、口座振替依頼書の画像データなど非構造化データの収集に成功。データ量は2022年12月時点でデータレイクが約500TB、データウェアハウスが約80TBにまで達し、Amazon Redshift導入前と比べて2倍以上のペースでデータが増加しています。Webベースのポータルサイトを構築し、データレイク上のデータに対してメタ情報を付与することで、簡単にデータの検索や抽出ができるようになっており、増加したデータも有効活用できているとのことです。

また、データを可視化するBIツールを本部と営業店に展開し、誰でもデータの利活用ができるようにしています。営業店では全店、全顧客のデータを横断的に検索できるようになり、大きな負荷となっていたデータの加工業務や集計作業が、大幅に軽減されました。

NTTドコモ

携帯キャリア通信大手のNTTドコモでは、2014年から全社共通のデータ分析基盤としてAmazon Redshiftを採用しています。統合データ分析基盤ができる以前は、企業内で設備やサービスごとにデータウェアハウスが分かれていました。そのため、総合的な分析を行う際には部署間での調整が必要で、時間を要していたそうです。また、顧客情報など漏えいが許されない情報を扱ううえで、セキュリティー基準を満たす必要がありました。そこで同社はスケーラビリティが高く、Amazon VPCやAWS IAMなどのセキュリティーサービスを活用できる、Amazon Redshiftを選定しました。

稼働後の2021年には、Amazon RedshiftがDS2ノードからRA3ノードにアップグレードされ、パフォーマンスが改善。ETL処理における処理速度は、従来の1.2~1.4倍にまで上昇したことで、利用者にSQLデータを提供するまでにかかる時間を約3時間短縮させることに成功しました。2022年4月時点で総データ量は6PB、データ加工処理の対象となる1日のデータ量は50TBにのぼり、蓄積された膨大なデータがデータ分析に活用されています。

  • DS2ノードは、現在では廃止されています。

Amazon Redshiftの料金体系

Amazon Redshiftは基本的に、ノードタイプの利用料金やストレージの利用料金や追加機能に応じて料金が発生する従量課金制です。ノードは「RA3」と「DC2」があり、用途に応じて選択することになります。なお、RA3の場合はマネージドストレージに関する費用も追加されます。

また、無料利用枠も用意されています。これまでにAmazon Redshift Serverlessを利用したことがない場合は、90日間の有効期限がある300 USD分のクレジットが付与され、料金の支払いに利用することが可能です。Amazon Redshift Serverlessが利用できないリージョンでは、DC2ラージノードの2カ月間無料トライアルの対象となります。

なお、本記事に記載しているのは2024年11月時点の情報であり、料金は変動する可能性があります。詳しくは、AWS公式の料金ページをご確認ください。

Amazon Redshift の料金|AWS 新規ウィンドウで開く

まとめ

企業に蓄積されたデータは活用できれば価値あるものとなりますが、データの保管にも一定のコストがかかります。そのため、かかるコスト以上の成果をデータ分析によって生み出す必要があります。Amazon Redshiftを活用すれば、他のサービスと組み合わせて高速なデータ分析を行えるデータ分析基盤の構築が可能です。この機会に、Amazon Redshiftの導入を検討してみてはいかがでしょうか。データウェアハウスの導入や、その他データの利活用についてお悩みの方は、TOKAIコミュニケーションズまでお気軽にご相談 新規ウィンドウで開くください。豊富な導入実績を持つ当社が、お客様のニーズに合った最適なプランを提案いたします。

関連サービス

導入のお問い合わせはこちら

AWSやAmazon WorkSpacesの導入から接続回線、運用・保守まで何でもお任せください。

お問い合わせ

TOPへ戻る