首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何使用火花流计算卡夫卡过去25天的流数据均值和方差

如何使用火花流计算卡夫卡过去25天的流数据均值和方差
EN

Stack Overflow用户
提问于 2016-11-23 01:52:03
回答 1查看 637关注 0票数 1

在kafka中有流数据,连续浮点数:

2016-11-23 :00

2016年-11-23 11:03:00

2016年-11-23 11:05:00

.

我想计算一下在过去25天中,这些浮点数的平均值和方差在上午11:00到12:00之间。

火花流是否适合处理此问题?

非常感谢!

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-11-23 10:18:19

@明,你可以用它作为摘要

代码语言:javascript
复制
val sparkConf = new SparkConf().setAppName("StreamCount")
    val ssc = new StreamingContext(sparkConf, Seconds(2))
    //update the time according to your need

    // Create direct kafka stream with brokers and topics
    val topicsSet = topics.split(",").toSet
    val kafkaParams = Map[String, String]("metadata.broker.list" -> brokers)
    val messages = KafkaUtils.createDirectStream[String, String, StringDecoder, StringDecoder](
      ssc, kafkaParams, topicsSet)

    // Get the lines, and timestamp data along with the float values


    SELECT    float_number
FROM      [YourTable]
WHERE     [YourDate] BETWEEN DATEADD(DAY, DATEDIFF(DAY, 0, GETDATE()), 0) + '11:00' AND DATEADD(DAY, DATEDIFF(DAY, 0, GETDATE()), 0) + '12:00'
//store it to a data frame

df.select(avg($"float_number")).show()
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/40754758

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档