赞
踩
属性
----------
cv_results_:numpy(masked)ndarrays的字典。字典可以将键作为列标题,将值作为列,可以将其导入到pandas ``DataFrame''中。
例如下面的表格
+------------+-----------+------------+-----------------+---+---------+
|param_kernel|param_gamma|param_degree|split0_test_score|...
|rank_t...|
+============+===========+============+========
=========+===+=========+
| 'poly' | -- | 2 | 0.80 |...| 2 |
+------------+-----------+------------+-----------------+---+---------+
| 'poly' | -- | 3 | 0.70 |...| 4 |
+------------+-----------+------------+-----------------+---+---------+
| 'rbf' | 0.1 | -- | 0.80 |...| 3 |
+------------+-----------+------------+-----------------+---+---------+
| 'rbf' | 0.2 | -- | 0.93 |...| 1 |
+------------+-----------+------------+-----------------+---+---------+
将由以下内容的“ cv_results_”字典表示:{
'param_kernel': masked_array(data = ['poly', 'poly', 'rbf', 'rbf'],
mask = [False False False False]...)
'param_gamma': masked_array(data = [-- -- 0.1 0.2],
mask = [ True True False False]...),
'param_degree': masked_array(data = [2.0 3.0 -- --],
mask = [False False True True]...),
'split0_test_score' : [0.80, 0.70, 0.80, 0.93],
'split1_test_score' : [0.82, 0.50, 0.70, 0.78],
'mean_test_score' : [0.81, 0.60, 0.75, 0.85],
'std_test_score' : [0.01, 0.10, 0.05, 0.08],
'rank_test_score' : [2, 4, 3, 1],
'split0_train_score' : [0.80, 0.92, 0.70, 0.93],
'split1_train_score' : [0.82, 0.55, 0.70, 0.87],
'mean_train_score' : [0.81, 0.74, 0.70, 0.90],
'std_train_score' : [0.01, 0.19, 0.00, 0.03],
'mean_fit_time' : [0.73, 0.63, 0.43, 0.49],
'std_fit_time' : [0.01, 0.02, 0.01, 0.01],
'mean_score_time' : [0.01, 0.06, 0.04, 0.04],
'std_score_time' : [0.00, 0.00, 0.00, 0.01],
'params' : [{'kernel': 'poly', 'degree': 2}, ...],
}
注意
键``params''用于存储所有候选参数的参数设置字典列表。
``mean_fit_time'',``std_fit_time'',``mean_score_time''和``std_score_time''都以秒为单位。
对于多指标评估,所有得分者的得分都可以在“ cv_results_” dict中以该得分者的名字(“ _ ””)而不是“ _score”的键获得。如上所示。 (“ split0_test_precision”,“ mean_train_precision”等)
best_estimator_:估算器。搜索选择的估算器,即在剩余数据上给出最高分(或最小损失,如果指定)的估算器。如果``refit = False'',则不可用。
有关允许值的更多信息,请参见“改装”参数。
best_score_:浮动。 best_estimator的平均交叉验证得分。对于多指标评估,仅在指定``refit''时才存在。如果``refit''是一个函数,则此属性不可用。
best_params_:字典。参数设置可使保留数据获得最佳结果。对于多指标评估,仅在指定``refit''时才存在。
best_index_:整数。与“ cv_results_”数组的索引相对应的最佳候选参数设置。 search.cv_results _ ['params'] [search.best_index_]上的字典给出了最佳模型的参数设置,该模型给出了最高的平均得分(“ search.best_score_”)。
对于多指标评估,仅在指定``refit''时才存在。
scorer_:函数或字典。对保留的数据使用记分器功能,以为模型选择最佳参数。对于多指标评估,此属性保存已验证的“评分”字典,该评分将记分员键映射到可调用的记分员。
n_splits_:整数。交叉验证拆分(折叠/迭代)的数量。
refit_time_:浮动。用于在整个数据集中重新拟合最佳模型的秒数。仅当``refit''不为False时才存在。
..版本添加:: 0.20
注意
-----
所选择的参数是那些使遗留数据的分数最大化的参数,除非传递了显式分数,否则将使用该显式分数。
如果将n_jobs的值设置为大于1的值,则会为网格中的每个点复制数据(而不是n_jobs次)。如果出于效率考虑,这样做是因为单个作业花费的时间很少,但是如果数据集很大且没有足够的可用内存,则可能会引发错误。这种情况下的解决方法是设置`pre_dispatch`。然后,该内存仅被复制一次pre_dispatch多次。 pre_dispatch的合理值是2 * n_jobs。
也可以看看
---------
ParameterGrid
生成超参数网格的所有组合。
:func:`sklearn.model_selection.train_test_split`:
实用程序功能将数据分为可用于拟合GridSearchCV实例的开发集和用于其最终评估的评估集。
:func:`sklearn.metrics.make_scorer`:
根据绩效指标或损失函数确定得分手。
“”
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。