在Apache Flink中使用允许的延迟有什么优势?例如:为什么不使用水印(乱序10个单位)而不是水印(乱序5个单位)+允许延迟(5个单位)?
发布于 2020-08-14 17:35:24
允许的延迟是窗口API中的一个概念--它不是一个通用的构造。
在水印+允许延迟的情况下,优点是一旦水印到达窗口结束时间,窗口将被触发并产生一些(初始)结果。因此,在窗口产生一些结果之前延迟较少,随着延迟事件的到来,更新结果的可能性更大-- vs --等待更长时间,并获得单个结果。
选择对您的用例更有意义的选项。例如,有些人有相当短的水印延迟(以秒为单位),允许的延迟以数十分钟为单位。如果他们总是不得不等待30或60分钟(例如)才能得到任何结果,他们将不会高兴。
https://stackoverflow.com/questions/63395185
复制相似问题