我有用户审查数据集,如
review-1, 0,1,1,0,0review-1是用户评审,0,1,1,0,0是审查类别。一个评审可以有多个类别。我想预测评论的类别。所以我实现了以下代码
transformer = TfidfVectorizer(lowercase=True, stop_words=stop, max_features=500)
X = transformer.fit_transform(df.Review)
X_train, X_test, y_train, y_test = train_test_split(X, df.iloc[:, 1:6],
test_size=0.25, random_state=42)
SVM = svm.SVC()
SVM.fit(X_train, y_train)但我的错误就像
ValueError: bad input shape (75, 5)有人能提出解决这个问题的好办法吗?
发布于 2019-02-13 08:49:02
您可以使用二进制分类器(如svm.SVC())来使用OneVsRestClassifier解决多标签分类问题。
示例:
from sklearn.multiclass import OneVsRestClassifier
from sklearn.svm import SVC
cls = OneVsRestClassifier(estimator=SVC(gamma ='auto'))
import numpy as np
cls.fit(np.random.rand(20,10),np.random.binomial(1,0.2,size=(20,5)))https://stackoverflow.com/questions/54665028
复制相似问题