首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用亚马逊网络服务数据管道在S3到EC2之间传输文件

使用亚马逊网络服务数据管道在S3到EC2之间传输文件
EN

Stack Overflow用户
提问于 2015-05-13 14:36:59
回答 4查看 2K关注 0票数 1

我想传输to级的数据从S3到EC2 Windows Server,然后再返回,这将需要几个小时,当使用基本的AWS CLI Copy command。为了帮助加快速度,我想使用AWS Data PipelineAWS Data Pipeline文档中的图形似乎表明数据至少可以从EC2流向S3:

然而,我发现很难理解如何做到这一点。我见过的最接近的例子是通过使用ShellCommandActivity来暂存数据的概念,它在将数据复制回S3之前将数据从S3 DataNode传输到EC2。

相反,我希望从已经运行的Windows实例上的S3复制数据,然后在以后将进一步的数据复制回S3。

EN

回答 4

Stack Overflow用户

发布于 2015-05-14 01:42:27

我相信这可以在没有数据管道的情况下完成-主要是为了消除一些复杂性。此工作可使用AWS CLI完成,Windows XP及更高版本上也提供此功能。如果计算机上没有AWS CLI,请查找MSI安装程序。

在*nix上:

代码语言:javascript
复制
aws s3 cp --recursive s3://somebucket ./

将s3存储桶内容复制到执行目录。

票数 1
EN

Stack Overflow用户

发布于 2015-05-19 07:40:24

简而言之,我认为在这种情况下使用亚马逊网络服务DataPipeline不会获得任何性能上的好处。

原因是任务运行器(数据管道使用的执行器)是not supported on Windows platform。因此,您尝试运行的任何活动实际上都会在不同的平台上运行,然后您可以将其scp/sftp到您的计算机上。

拉取数据到其他平台的EC2实例有不同的方式:

  1. 使用ShellCommandActivity:它不仅允许你上传也可以从S3 using env vairables下载,就像INPUT1_STAGING_DIR一样。虽然他们的文档没有提到他们的实现或性能改进,但我相信它正在使用S3的多部分API进行并行拉取。
  2. 使用EMR + s3distcp并将其放入硬盘文件系统中,然后使用getMerge

将其从硬盘文件系统中获取到本地磁盘

票数 1
EN

Stack Overflow用户

发布于 2015-05-20 04:53:58

您是否需要所有这些数据都存在于Windows计算机上?或者你打算断断续续地访问它?

您可以尝试挂载您的S3存储桶。

它仍然是远程的,但在Windows中的行为将像普通的挂载驱动器。如果您需要进行一些数据处理,则只需将此时所需的文件复制到本地磁盘。您可以使用S3browser、Cloudberry或上百个其他S3客户端挂载S3。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/30207339

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档