从 Amazon S3 传输数据到 Google Cloud Storage¶
Google Cloud Storage (GCS) 用于存储来自各种应用程序的大数据。与 Amazon Simple Storage Service 也类似。本页面展示了如何将数据从 Amazon S3 传输到 GCS。
前提任务¶
要使用这些 operators,您需要做几件事
使用 Cloud Console 选择或创建一个 Cloud Platform 项目。
为您的项目启用结算功能,如 Google Cloud 文档 中所述。
启用 API,如 Cloud Console 文档 中所述。
通过 pip 安装 API 库。
pip install 'apache-airflow[google]'安装 提供了详细信息。
使用 S3ToGCSOperator
将数据从 Amazon S3 传输到 Google Cloud Storage。
可以使用 deferrable 模式异步启动 S3ToGCSOperator。为此,只需在 operator 调用中添加参数 deferrable=True
。在底层,它将把数据传输委托给 Google Cloud Storage Transfer Service。通过更改参数 poll_interval=10
,您可以控制轮询传输作业状态的频率。
参考资料¶
如需更多信息,请参阅: