我想传输to级的数据从S3到EC2 Windows Server,然后再返回,这将需要几个小时,当使用基本的AWS CLI Copy command。为了帮助加快速度,我想使用AWS Data Pipeline,AWS Data Pipeline文档中的图形似乎表明数据至少可以从EC2流向S3:
然而,我发现很难理解如何做到这一点。我见过的最接近的例子是通过使用ShellCommandActivity来暂存数据的概念,它在将数据复制回S3之前将数据从S3 DataNode传输到EC2。
相反,我希望从已经运行的Windows实例上的S3复制数据,然后在以后将进一步的数据复制回S3。
发布于 2015-05-14 01:42:27
我相信这可以在没有数据管道的情况下完成-主要是为了消除一些复杂性。此工作可使用AWS CLI完成,Windows XP及更高版本上也提供此功能。如果计算机上没有AWS CLI,请查找MSI安装程序。
在*nix上:
aws s3 cp --recursive s3://somebucket ./将s3存储桶内容复制到执行目录。
发布于 2015-05-19 07:40:24
简而言之,我认为在这种情况下使用亚马逊网络服务DataPipeline不会获得任何性能上的好处。
原因是任务运行器(数据管道使用的执行器)是not supported on Windows platform。因此,您尝试运行的任何活动实际上都会在不同的平台上运行,然后您可以将其scp/sftp到您的计算机上。
拉取数据到其他平台的EC2实例有不同的方式:
将其从硬盘文件系统中获取到本地磁盘
发布于 2015-05-20 04:53:58
您是否需要所有这些数据都存在于Windows计算机上?或者你打算断断续续地访问它?
您可以尝试挂载您的S3存储桶。
它仍然是远程的,但在Windows中的行为将像普通的挂载驱动器。如果您需要进行一些数据处理,则只需将此时所需的文件复制到本地磁盘。您可以使用S3browser、Cloudberry或上百个其他S3客户端挂载S3。
https://stackoverflow.com/questions/30207339
复制相似问题