当前位置:   article > 正文

LightGBM算法——广告收益回归预测模型_lightgbm 回归模型

lightgbm 回归模型

案例背景

投资商经常会通过多个不同渠道投放广告,以此来获得经济利益。在本案例中我们选取公司在电视、广播和报纸上的投入,来预测广告收益,这对公司策略的制定是有较重要的意义。

模型搭建

  1. # 读取数据
  2. import pandas as pd
  3. df = pd.read_excel('广告收益数据.xlsx')
  4. df.head()

  1. # 1.提取特征变量和目标变量
  2. X = df.drop(columns='收益')
  3. y = df['收益']
  4. # 2.划分训练集和测试集
  5. from sklearn.model_selection import train_test_split
  6. X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=123)
  7. # 3. 模型训练和搭建
  8. from lightgbm import LGBMRegressor
  9. model = LGBMRegressor()
  10. model.fit(X_train, y_train)

 模型预测及评估

  1. # 预测测试数据
  2. y_pred = model.predict(X_test)
  3. y_pred[0:5]

  1. # 预测值和实际值对比
  2. a = pd.DataFrame() # 创建一个空DataFrame
  3. a['预测值'] = list(y_pred)
  4. a['实际值'] = list(y_test)
  5. a.head()

 

  1. # 查看评分
  2. model.score(X_test, y_test)

 

  1. # 特征重要性
  2. model.feature_importances_

 

模型参数调优 

  1. # 参数调优
  2. from sklearn.model_selection import GridSearchCV # 网格搜索合适的超参数
  3. parameters = {'num_leaves': [15, 31, 62], 'n_estimators': [20, 30, 50, 70], 'learning_rate': [0.1, 0.2, 0.3, 0.4]} # 指定分类器中参数的范围
  4. model = LGBMRegressor() # 构建模型
  5. grid_search = GridSearchCV(model, parameters,scoring='r2',cv=5) # cv=5表示交叉验证5次,scoring='r2'表示以R-squared作为模型评价准则
  6. # 输出参数最优值
  7. grid_search.fit(X_train, y_train) # 传入数据
  8. grid_search.best_params_ # 输出参数的最优值

  1. # 重新搭建LightGBM回归模型
  2. model = LGBMRegressor(num_leaves=31, n_estimators=50,learning_rate=0.3)
  3. model.fit(X_train, y_train)
  4. # 查看得分
  5. model.score(X_test, y_test)

 

 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/你好赵伟/article/detail/801514
推荐阅读
相关标签
  

闽ICP备14008679号