任何人都可以帮助解决这个错误吗?我正在用Pyspark编程,我试着用下面的代码计算一定的偏差:
Result = data.select(count(((coalesce(data["pred"], lit(0)))!=0 & (coalesce(data["val"],lit(0)) !=0
& (abs(coalesce(data["pred"], lit(0)) - coalesce(data["val"],lit(0)))/(coalesce(data["val"],lit(0)))) > 0.1))))即将出现以下错误:
"Py4JError: An error occurred while calling o230.and. Trace:
py4j.Py4JException: Method and([class java.lang.Integer]) does not exist
at py4j.reflection.ReflectionEngine.getMethod(ReflectionEngine.java:318)
at py4j.reflection.ReflectionEngine.getMethod(ReflectionEngine.java:326)
at py4j.Gateway.invoke(Gateway.java:274)
at py4j.commands.AbstractCommand.invokeMethod(AbstractCommand.java:132)
at py4j.commands.CallCommand.execute(CallCommand.java:79)
at py4j.GatewayConnection.run(GatewayConnection.java:238)
at java.lang.Thread.run(Thread.java:748)"我是一个非常非常新手的pyspark编程新手,根本不能发现我的代码出了什么问题;我用一个非常类似的代码做了一个非常类似的计算,但工作正常……有人知道问题出在哪里吗?
PS此代码,以及其他代码,是一个使用类似语法的不同计算:
Abs_avg = data.select(avg(abs(coalesce(data["pred"], lit(0)) - coalesce(data["val"],lit(0)))))发布于 2020-12-28 18:33:32
您需要将条件括在方括号中,否则它将解释为0 & something。此外,您也不需要在(...) != 0中包装...。
Result = data.select(
count(
(coalesce(data["pred"], lit(0)) != 0) &
(coalesce(data["val"], lit(0)) != 0) &
(abs(
coalesce(data["pred"], lit(0)) -
coalesce(data["val"], lit(0))
) / coalesce(data["val"], lit(0)) > 0.1
)
)
)https://stackoverflow.com/questions/65476228
复制相似问题