文章/答案/技术大牛

发布

社区首页 >问答首页 >机器学习目标:给定10万名学生，预测3,000名学生，并将该组的中位成绩降到最低。

问机器学习目标:给定10万名学生，预测3,000名学生，并将该组的中位成绩降到最低。
EN

Data Science用户

提问于 2020-06-17 16:44:45

回答 1查看 54关注 0票数 1

换句话说，我期待的是预测学生会在失败之前辍学。这些数据包括社会经济状况和其他相关变量。

我尝试过XGB二进制分类(树和森林)，但问题是它不会严重地惩罚错误的答案(预测一个学生在成绩上将排在最后3%，但他们实际上是A+学生)。结果是，被预测的学生的平均成绩很低，但是中位成绩并没有那么差--有少数极差的学生降低了平均分，而不是中位数。

我尝试过XGB回归(包括树和森林)，但问题是我无法让模型集中在底部的3%。它试图减少所有预测的错误。我不在乎说出A学生和B学生之间的区别，我只需要始终如一地找出最低的3%。

我在想，也许这有助于加强学习，而不是监督，但我对加固一无所知.WOuld有可能建立一个强化模型，其目标是将3%的学生预测的中位成绩降到最低？或者还有其他的机器学习技术能起作用？

regression

reinforcement-learning

xgboost

python

classification

回答 1

Data Science用户

回答已采纳

发布于 2020-06-17 17:13:05

尝试为回归模型编写自定义丢失函数！

例如，Keras的神经网络支持这一点。请参阅https://stackoverflow.com/q/43818584/745868

(但许多其他库也对此提供支持)

您的自定义丢失函数唯一的特殊之处是，如果min(pred_y，actual_y) >=阈值，它不会将数据点的错误加在一起。

票数 1

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/76179

复制

相似问题

问机器学习目标:给定10万名学生，预测3,000名学生，并将该组的中位成绩降到最低。
EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问机器学习目标:给定10万名学生，预测3,000名学生，并将该组的中位成绩降到最低。EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问机器学习目标:给定10万名学生，预测3,000名学生，并将该组的中位成绩降到最低。
EN