首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何对不平衡的数据集执行类平衡

如何对不平衡的数据集执行类平衡
EN

Stack Overflow用户
提问于 2019-04-11 11:26:48
回答 1查看 140关注 0票数 1

我有一个不平衡的数据集,有更多的正面评价(90%)比负面(10%),下面的选项我应该遵循。

  1. class_weight='balanced'在GridsearchCV(培训和简历)和物流(培训和测试)中的应用
  2. 将数据分成训练、简历和测试集,然后以多数类(我的情况是+ve类)对少数类进行过度抽样。因此,这两个类都是平衡的。
  3. 欠采样-不考虑由于信息的损失。
EN

回答 1

Stack Overflow用户

发布于 2019-04-11 15:20:26

不幸的是,对于自然语言数据,没有很多好的选择。-One快速方法实际上是对正类进行欠采样,对负类进行过采样,从而带来更多的平衡。-一个更复杂的方法是使用GANs创建更多的负面示例

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/55631410

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档