sklearn grid search with grouped K fold cv generator

Tags:

scikit-learn

cross-validation

I am trying to implement a grid search over parameters in sklearn using randomized search and a grouped k fold cross-validation generator. The following works:

skf=StratifiedKFold(n_splits=5,shuffle=True,random_state=0)
rs=sklearn.model_selection.RandomizedSearchCV(clf,parameters,scoring='roc_auc',cv=skf,n_iter=10)
rs.fit(X,y)

This doesn't

gkf=GroupKFold(n_splits=5)
rs=sklearn.model_selection.RandomizedSearchCV(clf,parameters,scoring='roc_auc',cv=gkf,n_iter=10)
rs.fit(X,y)

#ValueError: The groups parameter should not be None

How do I indicate the groups parameter?

Neither does this

gkf=GroupKFold(n_splits=5)
fv = gkf.split(X, y, groups=groups)
rs=sklearn.model_selection.RandomizedSearchCV(clf,parameters,scoring='roc_auc',cv=gkf,n_iter=10)
rs.fit(X,y)

#TypeError: object of type 'generator' has no len()

654

asked Mar 17 '17 14:03

user0

1 Answers

For reference, this is done via

rs.fit(X,y,groups=groups)

for

rs=sklearn.model_selection.RandomizedSearchCV(forest,parameters,scoring='roc_auc',cv=gkf,n_iter=10)

135

answered Oct 19 '22 04:10

user0

Related questions
                            
                                Create a custom sklearn TransformerMixin that transforms categorical variables consistently
                            
                                How to plot SVM decision boundary in sklearn Python?
                            
                                Python: Cosine similarity between two large numpy arrays
                            
                                ValueError: unknown is not supported in sklearn.RFECV
                            
                                Periodic Data with Machine Learning (Like Degree Angles -> 179 is 2 different from -179)
                            
                                Sklearn PCA is pca.components_ the loadings?
                            
                                Speed of SVM Kernels? Linear vs RBF vs Poly
                            
                                how to choose parameters in TfidfVectorizer in sklearn during unsupervised clustering
                            
                                How to use Dynamic Time warping with kNN in python
                            
                                Sklearn set_config is erroring
                            
                                TMUX Session Won't Import Python Module
                            
                                Pass estimator to custom score function via sklearn.metrics.make_scorer
                            
                                Spark.ml regressions do not calculate same models as scikit-learn
                            
                                Matplotlib Scatter - ValueError: RGBA sequence should have length 3 or 4
                            
                                How to scale input DBSCAN in scikit-learn
                            
                                scikit-learn roc_auc_score() returns accuracy values
                            
                                How to clone an scikit-learn estimator including its data?
                            
                                fit method in python sklearn
                            
                                How to use the output from OneHotEncoder in sklearn?
                            
                                How to draw a precision-recall curve with interpolation in python?

Donate For Us

If you love us? You can donate to us via Paypal or buy me a coffee so we can maintain and grow! Thank you!

Donate Us With

sklearn grid search with grouped K fold cv generator

Tags:

scikit-learn

cross-validation

user0

People also ask

1 Answers

user0

Recent Activity

Donate For Us