我有一个不平衡的数据集,有更多的正面评价(90%)比负面(10%),下面的选项我应该遵循。
class_weight='balanced'在GridsearchCV(培训和简历)和物流(培训和测试)中的应用发布于 2019-04-11 15:20:26
不幸的是,对于自然语言数据,没有很多好的选择。-One快速方法实际上是对正类进行欠采样,对负类进行过采样,从而带来更多的平衡。-一个更复杂的方法是使用GANs创建更多的负面示例。
https://stackoverflow.com/questions/55631410
复制相似问题