我有一个主用例,在这个用例中,我希望有一个事务关系数据库,而我正在对它使用Postgres。
我还需要对数据运行频繁的聚合查询(计数、和、平均值)。这些统计数据不能预先计算,因为我们必须提供多个搜索过滤器。
我最初考虑使用Redshift作为辅助存储,它可以提供这些查询,但随后我还需要构建一个系统,以使两个存储之间的数据保持同步。
是否有更好的方法来实现这一点?
发布于 2019-01-24 08:36:57
看看AWS,您可以将其设置为在Redshift上保存一个接近实时的Postgres数据副本。
它是可靠的,并且需要最少的维护(例如,如果您向源数据添加了新列)。
仔细阅读这两个方面,特别是限制和要求。
Source.PostgreSQL.html和Target.Redshift.html
除非您需要它们,否则我建议将文本(和其他大型对象)列排除在同步之外。这可以很容易地通过设置一个标志来完成,或者可以一列一列地定制。
源Postgres数据库不必保存在AWS上。
https://stackoverflow.com/questions/54342103
复制相似问题