文章/答案/技术大牛

发布

社区首页 >问答首页 >使用亚马逊网络服务数据管道在S3到EC2之间传输文件

问使用亚马逊网络服务数据管道在S3到EC2之间传输文件
EN

Stack Overflow用户

提问于 2015-05-13 14:36:59

回答 4查看 2K关注 0票数 1

我想传输to级的数据从S3到EC2 Windows Server，然后再返回，这将需要几个小时，当使用基本的AWS CLI Copy command。为了帮助加快速度，我想使用AWS Data Pipeline，AWS Data Pipeline文档中的图形似乎表明数据至少可以从EC2流向S3：

然而，我发现很难理解如何做到这一点。我见过的最接近的例子是通过使用ShellCommandActivity来暂存数据的概念，它在将数据复制回S3之前将数据从S3 DataNode传输到EC2。

相反，我希望从已经运行的Windows实例上的S3复制数据，然后在以后将进一步的数据复制回S3。

amazon-web-services

amazon-ec2

amazon-s3

amazon-data-pipeline

回答 4

Stack Overflow用户

发布于 2015-05-14 01:42:27

我相信这可以在没有数据管道的情况下完成-主要是为了消除一些复杂性。此工作可使用AWS CLI完成，Windows XP及更高版本上也提供此功能。如果计算机上没有AWS CLI，请查找MSI安装程序。

在*nix上：

aws s3 cp --recursive s3://somebucket ./

将s3存储桶内容复制到执行目录。

票数 1

Stack Overflow用户

发布于 2015-05-19 07:40:24

简而言之，我认为在这种情况下使用亚马逊网络服务DataPipeline不会获得任何性能上的好处。

原因是任务运行器(数据管道使用的执行器)是not supported on Windows platform。因此，您尝试运行的任何活动实际上都会在不同的平台上运行，然后您可以将其scp/sftp到您的计算机上。

拉取数据到其他平台的EC2实例有不同的方式：

使用ShellCommandActivity:它不仅允许你上传也可以从S3 using env vairables下载，就像INPUT1_STAGING_DIR一样。虽然他们的文档没有提到他们的实现或性能改进，但我相信它正在使用S3的多部分API进行并行拉取。
使用EMR + s3distcp并将其放入硬盘文件系统中，然后使用getMerge

将其从硬盘文件系统中获取到本地磁盘

票数 1

Stack Overflow用户

发布于 2015-05-20 04:53:58

您是否需要所有这些数据都存在于Windows计算机上？或者你打算断断续续地访问它？

您可以尝试挂载您的S3存储桶。

它仍然是远程的，但在Windows中的行为将像普通的挂载驱动器。如果您需要进行一些数据处理，则只需将此时所需的文件复制到本地磁盘。您可以使用S3browser、Cloudberry或上百个其他S3客户端挂载S3。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/30207339

复制

相似问题

问使用亚马逊网络服务数据管道在S3到EC2之间传输文件
EN

回答 4

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用亚马逊网络服务数据管道在S3到EC2之间传输文件EN

回答 4

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用亚马逊网络服务数据管道在S3到EC2之间传输文件
EN