type
status
date
slug
summary
tags
category
icon
password
 

理論

AWSによる画像データのアーカイブとコスト効率の最適化

  1. AWS DataSync
      • オンプレミスからAWSへのデータ転送を効率的に管理できるサービス。
      • 大量のデータを高スループットで移行でき、転送のスケジュールや帯域幅制限の設定も可能。
  1. S3 Glacier Deep Archive
      • 最もコスト効率の良い長期アーカイブ用ストレージ。
      • 頻繁にアクセスされないデータ(例えば、バックアップやアーカイブ用データ)の保存に適しており、アクセスが必要な場合でも低コストで保存できます。
  1. Storage Gateway
      • オンプレミスのストレージとAWSクラウドのストレージを接続し、クラウドバックアップやアーカイブを行うためのサービス。
      • Tape Gatewayはテープバックアップシステムを仮想化するため、主にバックアップ用途に適していますが、今回のシンプルなデータアーカイブには過剰な選択肢。

結論

  • 大量の画像データを効率的かつコスト効果高くアーカイブするには、AWS DataSyncを使い、S3 Glacier Deep Archiveにデータを直接転送する方法が最も適しています。
  • ストレージと転送コストを最適化するためには、S3 Glacier Deep Archiveが最適な選択肢です。

実践

一問道場

質問 #457
ある企業が、オンプレミスで画像データを解析し保存するアプリケーションを運用しています。このアプリケーションは毎日数百万件の新しい画像ファイルを受信します。
ファイルのサイズは平均1MBです。ファイルは1GBのバッチで解析され、バッチの解析が完了すると、画像は1つのファイルに圧縮され、長期保存のためにオンプレミスのNFSサーバーにアーカイブされます。
企業はオンプレミスにMicrosoft Hyper-V環境を持ち、コンピューティングリソースは利用可能です。ただし、ストレージ容量が不足しており、画像をAWSにアーカイブしたいと考えています。企業は、リクエストから1週間以内にアーカイブされたデータを取得できる必要があります。
企業は、オンプレミスのデータセンターとAWS間に10GbpsのAWS Direct Connect接続を持っています。企業は帯域幅制限を設定し、非営業時間中にアーカイブ画像をAWSにコピーするスケジュールを設定する必要があります。
どのソリューションが最もコスト効率よくこれらの要件を満たすでしょうか?
A. 新しいGPUベースのAmazon EC2インスタンスにAWS DataSyncエージェントをデプロイし、DataSyncエージェントを構成してNFSオンプレミスサーバーからAmazon S3 Glacier Instant Retrievalにファイルのバッチをコピーします。コピーが完了したら、オンプレミスのストレージからデータを削除します。
B. オンプレミスのHyper-V VMにAWS DataSyncエージェントをデプロイし、DataSyncエージェントを構成してNFSオンプレミスサーバーからAmazon S3 Glacier Deep Archiveにファイルのバッチをコピーします。コピーが完了したら、オンプレミスのストレージからデータを削除します。
C. 新しい一般的なAmazon EC2インスタンスにAWS DataSyncエージェントをデプロイし、DataSyncエージェントを構成してNFSオンプレミスサーバーからAmazon S3 Standardにファイルのバッチをコピーします。コピーが完了したら、オンプレミスのストレージからデータを削除します。その後、S3ライフサイクルルールを作成し、オブジェクトを1日後にS3 Glacier Deep Archiveに移行します。
D. AWS Storage Gateway Tape GatewayをオンプレミスのHyper-V環境にデプロイし、Tape GatewayをAWSに接続します。自動テープ作成を使用し、Amazon S3 Glacier Deep Archiveプールを指定します。バッチ画像がコピーされた後にテープを排出します。

解説

この問題では、企業がAWSに画像データをアーカイブし、非業務時間に帯域幅制限を設定してコピーを行う最もコスト効率の良い方法を求めています。各選択肢について詳しく見ていきましょう。

A. GPUベースのEC2インスタンスを使用

  • GPUベースのEC2インスタンスは、画像解析などの高負荷処理には向いていますが、今回はデータのコピーという比較的シンプルな操作です。GPUは不要であり、この選択肢はオーバースペックです。
  • Amazon S3 Glacier Instant Retrievalは、低レイテンシでデータにアクセスできるストレージですが、コストが高いため、長期保存には適していません。今回の要件には過剰なストレージクラスです。

B. Hyper-V VMにDataSyncエージェントをデプロイ

  • AWS DataSyncエージェントを使用して、データをS3 Glacier Deep Archiveにコピーするのは適切です。S3 Glacier Deep Archiveは最もコスト効率が良いアーカイブ用ストレージです。アーカイブデータの長期保存に適しており、頻繁にアクセスしないデータに最適です。
  • この方法は、データの移行におけるコストを最小化し、帯域幅制限を設定するのにも柔軟です。

C. EC2インスタンスでDataSyncエージェントを使用

  • S3 Standardを使うと、データの長期保存にはコストが高くなるため、これは長期アーカイブには適していません。
  • S3 Glacier Deep Archiveに移行するためのライフサイクルルールを作成することは可能ですが、最初にS3 Standardに保存するのは非効率的でコストがかさむ可能性があります。

D. AWS Storage Gateway Tape Gatewayを使用

  • Tape Gatewayはテープバックアップの仮想化サービスで、主にバックアップやアーカイブの用途に使用されますが、現在の要件には過剰であり、シンプルなデータコピーのシナリオでは不必要です。テープ作成や管理が追加され、管理が複雑になります。

結論

最もコスト効率が良い選択肢は、B. AWS DataSyncエージェントをHyper-V VMにデプロイして、S3 Glacier Deep Archiveにコピーする方法です。この選択肢は、低コストのアーカイブストレージであるS3 Glacier Deep Archiveを使用し、オンプレミスのストレージを削除することでコスト削減が可能です。
相关文章
クラウド技術の共有 | AWS Site-to-Site
Lazy loaded image
EKSでのWordPressデプロイ:KCNA-JP試験対策 (Kubernetes実践編)
Lazy loaded image
初心者向け!コンテナ化WordPressサイト構築ガイド(超詳細版)
Lazy loaded image
EFSを活用!AWS EC2でDockerを使ったWordPressサイト構築
Lazy loaded image
529-AWS SAP AWS 「理論・実践・一問道場」VPCエンドポイント
Lazy loaded image
528-AWS SAP AWS 「理論・実践・一問道場」Migration Evaluator
Lazy loaded image
458-AWS SAP AWS 「理論・実践・一問道場」Amazon CloudWatch456-AWS SAP AWS 「理論・実践・一問道場」AWS Batch と EC2スポットインスタンス
Loading...
みなみ
みなみ
一个普通的干饭人🍚
最新发布
02-生成AIパスポート試験対策:第2章「生成AI」
2025-2-1
01-生成AIパスポート試験対策:第1章「人口知能」
2025-2-1
究極のAWS認定 AI 実践者 AIF-C01 - 学習メモ
2025-1-27
不要再傻傻的直接买NISA啦
2025-1-27
Kubernetes、仮想マシンとコンテナの概念を超簡単に解説!
2025-1-24
529-AWS SAP AWS 「理論・実践・一問道場」VPCエンドポイント
2025-1-22
公告
🎉欢迎访问我的博客🎉
- 感谢您的支持 --
本站点于2024/09/01建立
👏主要分享IT相关主题👏
系统管理:
Redhat…
容器和编排:
Kubernetes、Openshift…
云计算:
AWS、IBM…
AI入门
以及技术笔记和考证经验
定期更新,欢迎互动。
感谢访问!
快速浏览相关标签