当前位置:   article > 正文

python gridsearchcv_Python之sklearn:GridSearchCV()函数的简介、具体案例、使用方法详细攻略...

python gridsearchcv

属性

----------

cv_results_:numpy(masked)ndarrays的字典。字典可以将键作为列标题,将值作为列,可以将其导入到pandas ``DataFrame''中。

例如下面的表格

+------------+-----------+------------+-----------------+---+---------+

|param_kernel|param_gamma|param_degree|split0_test_score|...

|rank_t...|

+============+===========+============+========

=========+===+=========+

|  'poly'    |     --    |      2     |       0.80      |...|    2    |

+------------+-----------+------------+-----------------+---+---------+

|  'poly'    |     --    |      3     |       0.70      |...|    4    |

+------------+-----------+------------+-----------------+---+---------+

|  'rbf'     |     0.1   |     --     |       0.80      |...|    3    |

+------------+-----------+------------+-----------------+---+---------+

|  'rbf'     |     0.2   |     --     |       0.93      |...|    1    |

+------------+-----------+------------+-----------------+---+---------+

将由以下内容的“ cv_results_”字典表示:{

'param_kernel': masked_array(data = ['poly', 'poly', 'rbf', 'rbf'],

mask = [False False False False]...)

'param_gamma': masked_array(data = [-- -- 0.1 0.2],

mask = [ True  True False False]...),

'param_degree': masked_array(data = [2.0 3.0 -- --],

mask = [False False  True  True]...),

'split0_test_score'  : [0.80, 0.70, 0.80, 0.93],

'split1_test_score'  : [0.82, 0.50, 0.70, 0.78],

'mean_test_score'    : [0.81, 0.60, 0.75, 0.85],

'std_test_score'     : [0.01, 0.10, 0.05, 0.08],

'rank_test_score'    : [2, 4, 3, 1],

'split0_train_score' : [0.80, 0.92, 0.70, 0.93],

'split1_train_score' : [0.82, 0.55, 0.70, 0.87],

'mean_train_score'   : [0.81, 0.74, 0.70, 0.90],

'std_train_score'    : [0.01, 0.19, 0.00, 0.03],

'mean_fit_time'      : [0.73, 0.63, 0.43, 0.49],

'std_fit_time'       : [0.01, 0.02, 0.01, 0.01],

'mean_score_time'    : [0.01, 0.06, 0.04, 0.04],

'std_score_time'     : [0.00, 0.00, 0.00, 0.01],

'params'             : [{'kernel': 'poly', 'degree': 2}, ...],

}

注意

键``params''用于存储所有候选参数的参数设置字典列表。

``mean_fit_time'',``std_fit_time'',``mean_score_time''和``std_score_time''都以秒为单位。

对于多指标评估,所有得分者的得分都可以在“ cv_results_” dict中以该得分者的名字(“ _ ””)而不是“ _score”的键获得。如上所示。 (“ split0_test_precision”,“ mean_train_precision”等)

best_estimator_:估算器。搜索选择的估算器,即在剩余数据上给出最高分(或最小损失,如果指定)的估算器。如果``refit = False'',则不可用。

有关允许值的更多信息,请参见“改装”参数。

best_score_:浮动。 best_estimator的平均交叉验证得分。对于多指标评估,仅在指定``refit''时才存在。如果``refit''是一个函数,则此属性不可用。

best_params_:字典。参数设置可使保留数据获得最佳结果。对于多指标评估,仅在指定``refit''时才存在。

best_index_:整数。与“ cv_results_”数组的索引相对应的最佳候选参数设置。 search.cv_results _ ['params'] [search.best_index_]上的字典给出了最佳模型的参数设置,该模型给出了最高的平均得分(“ search.best_score_”)。

对于多指标评估,仅在指定``refit''时才存在。

scorer_:函数或字典。对保留的数据使用记分器功能,以为模型选择最佳参数。对于多指标评估,此属性保存已验证的“评分”字典,该评分将记分员键映射到可调用的记分员。

n_splits_:整数。交叉验证拆分(折叠/迭代)的数量。

refit_time_:浮动。用于在整个数据集中重新拟合最佳模型的秒数。仅当``refit''不为False时才存在。

..版本添加:: 0.20

注意

-----

所选择的参数是那些使遗留数据的分数最大化的参数,除非传递了显式分数,否则将使用该显式分数。

如果将n_jobs的值设置为大于1的值,则会为网格中的每个点复制数据(而不是n_jobs次)。如果出于效率考虑,这样做是因为单个作业花费的时间很少,但是如果数据集很大且没有足够的可用内存,则可能会引发错误。这种情况下的解决方法是设置`pre_dispatch`。然后,该内存仅被复制一次pre_dispatch多次。 pre_dispatch的合理值是2 * n_jobs。

也可以看看

---------

ParameterGrid

生成超参数网格的所有组合。

:func:`sklearn.model_selection.train_test_split`:

实用程序功能将数据分为可用于拟合GridSearchCV实例的开发集和用于其最终评估的评估集。

:func:`sklearn.metrics.make_scorer`:

根据绩效指标或损失函数确定得分手。

“”

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/知新_RL/article/detail/463843
推荐阅读
相关标签
  

闽ICP备14008679号