当前位置: 首页 > news >正文

其他公司做的网站系统没授权能用吗百度站长平台怎么用

其他公司做的网站系统没授权能用吗,百度站长平台怎么用,千万不要签劳务外包合同,聊城网站建设品牌目录 引言 1. 数据收集与预处理 2. 划分数据集 3. 构建随机森林模型 4. 模型训练 5. 模型评估 6. 模型调优 数据集 代码及结果 独热编码 随机森林模型训练 特征重要性图 混淆矩阵 ROC曲线 引言 随机森林(Random Forest)是一种集成学习方法…

目录

引言

1. 数据收集与预处理

2. 划分数据集

3. 构建随机森林模型

4. 模型训练

5. 模型评估

6. 模型调优

数据集

代码及结果

独热编码

随机森林模型训练

特征重要性图

混淆矩阵

ROC曲线


引言

随机森林(Random Forest)是一种集成学习方法,它通过构建多个决策树并将它们的预测结果进行综合来改进模型的预测准确性和鲁棒性。在预测汽车销售方面,随机森林可以有效地处理包含多种特征(如车辆品牌、型号、年份、里程数、配置、价格等)的数据集,并预测销售数量、价格或顾客购买意向等。

以下是使用随机森林模型预测汽车销售的基本步骤:

1. 数据收集与预处理

  • 收集数据:首先,需要收集汽车销售的相关数据。这些数据可能包括车辆的技术规格、历史销售价格、市场需求数据、客户反馈等。
  • 数据清洗:去除重复项、缺失值处理(可以通过插值、删除或使用预测模型填补缺失值)、异常值处理等。
  • 特征选择:选择对汽车销售有显著影响的特征,比如车型、品牌、年份、配置、价格等。
  • 特征工程:对特征进行编码(如将分类变量转换为数值型),可能还需要进行特征缩放(如归一化或标准化)。

2. 划分数据集

  • 将数据集划分为训练集和测试集(通常按70%-30%或80%-20%的比例划分)。训练集用于训练模型,测试集用于评估模型的性能。

3. 构建随机森林模型

  • 使用训练集构建随机森林模型。随机森林模型的关键参数包括决策树的数量(n_estimators)、每个决策树分裂时考虑的特征数(max_features)、树的深度(如果设置了)等。
  • 通过交叉验证(如网格搜索)来优化这些参数,以找到最佳的模型配置。

4. 模型训练

  • 使用训练集数据训练随机森林模型。

5. 模型评估

  • 使用测试集评估模型的性能。评估指标可能包括准确率、召回率、F1分数、均方误差(MSE)等,具体取决于预测目标(如销售数量、价格或购买意向)。

6. 模型调优

  • 根据评估结果调整模型参数或进行特征工程,以进一步提高模型性能。

数据集

数据集如下图所示:

代码及结果

import pandas as pd  
from sklearn.model_selection import train_test_split  
from sklearn.linear_model import LinearRegression  
from sklearn.metrics import mean_squared_error  
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score # 加载数据集  
data = pd.read_csv('D:/项目/汽车销售/汽车销售财务业绩.csv',encoding='GBK') 
# 查看数据集的维度
print(data.shape)
# 查看数据集的前几行
print(data.head())

独热编码

独热编码(One-Hot Encoding)是一种常用的将类别型数据(Categorical Data)转换为数值型数据(Numerical Data)的方法,特别适用于机器学习算法中。在独热编码中,每个类别值都会被转换成一个新的二进制列(也称为哑变量),这些列中只有一个为1(表示该样本属于该类别),其余为0。这种方法能够确保模型能够正确处理类别型数据,并且每个类别都被视为完全独立的特征。

#文本分析,使用独热编码将文本型数据转换为数值型数据# 对'销售类型'进行独热编码  
sales_type_onehot = pd.get_dummies(data['销售类型'], prefix='销售类型')  # 对'销售模式'进行独热编码  
sales_mode_onehot = pd.get_dummies(data['销售模式'], prefix='销售模式')  # 将独热编码的DataFrame与原始DataFrame(除去'销售类型'、'销售模式'和'输出'列)合并   
data_without_categorical = data.drop(['销售类型', '销售模式', '输出'], axis=1)  
data_encoded = pd.concat([data_without_categorical, sales_type_onehot, sales_mode_onehot], axis=1)  # 将最后一列作为目标变量(y)  
y = data['输出'].map({'正常': 0, '异常': 1})  # 其余作为特征(X)  
X = data_encoded  

随机森林模型训练

 # 机器学习选择随机森林算法
# 划分训练集和测试集  
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)    # 创建随机森林分类器  
from sklearn.ensemble import RandomForestClassifier  
clf = RandomForestClassifier(n_estimators=100, random_state=42)    # 训练模型  
clf.fit(X_train, y_train)    # 预测测试集  
y_pred = clf.predict(X_test)    # 评估模型  
from sklearn.metrics import accuracy_score  
accuracy = accuracy_score(y_test, y_pred)    
print(f'Model accuracy: {accuracy}')

特征重要性图

import matplotlib.pyplot as plt  
import numpy as np# 获取特征重要性  
importances = clf.feature_importances_  
std = np.std([tree.feature_importances_ for tree in clf.estimators_], axis=0)  
indices = np.argsort(importances)[::-1]  # 绘制特征重要性  
plt.figure()  
plt.title("Feature importances")  
plt.bar(range(X_train.shape[1]), importances[indices],  color="r", yerr=std[indices], align="center")  
plt.xticks(range(X_train.shape[1]), indices)  
plt.xlim([-1, X_train.shape[1]])  
plt.show()

混淆矩阵

from sklearn.metrics import confusion_matrix  
from sklearn.metrics import plot_confusion_matrix  # 绘制混淆矩阵  
cm = confusion_matrix(y_test, y_pred)  
disp = plot_confusion_matrix(clf, X_test, y_test,  display_labels=['正常', '异常'],  cmap=plt.cm.Blues,  normalize=None)  
disp.ax_.set_title('Confusion Matrix')  
plt.show()

ROC曲线

from sklearn.metrics import roc_curve, auc  
from sklearn.metrics import plot_roc_curve  # 计算ROC曲线和AUC  
fpr, tpr, thresholds = roc_curve(y_test, clf.predict_proba(X_test)[:, 1])  
roc_auc = auc(fpr, tpr)  # 绘制ROC曲线  
plt.figure()  
lw = 2  
plt.plot(fpr, tpr, color='darkorange', lw=lw, label='ROC curve (area = %0.2f)' % roc_auc)  
plt.plot([0, 1], [0, 1], color='navy', lw=lw, linestyle='--')  
plt.xlim([0.0, 1.0])  
plt.ylim([0.0, 1.05])  
plt.xlabel('False Positive Rate')  
plt.ylabel('True Positive Rate')  
plt.title('Receiver Operating Characteristic Example')  
plt.legend(loc="lower right")  
plt.show()


文章转载自:
http://dinncofenian.bpmz.cn
http://dinnconomism.bpmz.cn
http://dinncosplurgy.bpmz.cn
http://dinncoganoin.bpmz.cn
http://dinncogoth.bpmz.cn
http://dinncoautogeneration.bpmz.cn
http://dinncoliquidly.bpmz.cn
http://dinncosamlet.bpmz.cn
http://dinncosupremacy.bpmz.cn
http://dinncopermian.bpmz.cn
http://dinncograd.bpmz.cn
http://dinncounclean.bpmz.cn
http://dinncocivic.bpmz.cn
http://dinncoaft.bpmz.cn
http://dinncoarteriolar.bpmz.cn
http://dinncobissau.bpmz.cn
http://dinncoobmutescence.bpmz.cn
http://dinncobehind.bpmz.cn
http://dinncolysogenic.bpmz.cn
http://dinncoborzoi.bpmz.cn
http://dinncocarucage.bpmz.cn
http://dinncodiethyl.bpmz.cn
http://dinncoratepaying.bpmz.cn
http://dinncoottar.bpmz.cn
http://dinncoaeroembolism.bpmz.cn
http://dinnconaggish.bpmz.cn
http://dinncothey.bpmz.cn
http://dinncoclockwise.bpmz.cn
http://dinncokishinev.bpmz.cn
http://dinncoexhaustive.bpmz.cn
http://dinncounprovided.bpmz.cn
http://dinncoslumlord.bpmz.cn
http://dinncodiscourteously.bpmz.cn
http://dinncodewlap.bpmz.cn
http://dinncotypographic.bpmz.cn
http://dinncocerebrosclerosis.bpmz.cn
http://dinncoamends.bpmz.cn
http://dinncotechnicolor.bpmz.cn
http://dinncosceneman.bpmz.cn
http://dinncocamerlingate.bpmz.cn
http://dinncounappreciation.bpmz.cn
http://dinncodominica.bpmz.cn
http://dinncomiscellanist.bpmz.cn
http://dinncobespeckle.bpmz.cn
http://dinncoorator.bpmz.cn
http://dinnconoyade.bpmz.cn
http://dinncophotocinesis.bpmz.cn
http://dinncocozen.bpmz.cn
http://dinncocopihue.bpmz.cn
http://dinncosorbonnist.bpmz.cn
http://dinncoattain.bpmz.cn
http://dinncocapper.bpmz.cn
http://dinncoindefeasible.bpmz.cn
http://dinncoappropriable.bpmz.cn
http://dinncomatchless.bpmz.cn
http://dinncolollardy.bpmz.cn
http://dinncooperative.bpmz.cn
http://dinncogarcon.bpmz.cn
http://dinncosoed.bpmz.cn
http://dinncopiazza.bpmz.cn
http://dinncozenophobia.bpmz.cn
http://dinncobound.bpmz.cn
http://dinncobabbittry.bpmz.cn
http://dinncodelitescent.bpmz.cn
http://dinncoextraneous.bpmz.cn
http://dinncocombine.bpmz.cn
http://dinncoallergy.bpmz.cn
http://dinncoserigraphy.bpmz.cn
http://dinncosphingolipid.bpmz.cn
http://dinncoaletophyte.bpmz.cn
http://dinncovolumeless.bpmz.cn
http://dinncopelvimeter.bpmz.cn
http://dinncodrugster.bpmz.cn
http://dinncocite.bpmz.cn
http://dinncoismec.bpmz.cn
http://dinncodeodorization.bpmz.cn
http://dinncofrijol.bpmz.cn
http://dinncoparodos.bpmz.cn
http://dinncosegregant.bpmz.cn
http://dinncodrivetrain.bpmz.cn
http://dinncoirl.bpmz.cn
http://dinncoatween.bpmz.cn
http://dinncoosmiridium.bpmz.cn
http://dinnconutria.bpmz.cn
http://dinncopensioner.bpmz.cn
http://dinncochainbelt.bpmz.cn
http://dinncofibro.bpmz.cn
http://dinncodrawable.bpmz.cn
http://dinncohealthful.bpmz.cn
http://dinncotaaffeite.bpmz.cn
http://dinncocrackable.bpmz.cn
http://dinncoremedially.bpmz.cn
http://dinnconephology.bpmz.cn
http://dinncohpgc.bpmz.cn
http://dinncostonehearted.bpmz.cn
http://dinncodiarial.bpmz.cn
http://dinncopeshitta.bpmz.cn
http://dinncoheteromorphosis.bpmz.cn
http://dinncopeart.bpmz.cn
http://dinncocotquean.bpmz.cn
http://www.dinnco.com/news/103316.html

相关文章:

  • 手机软件网站百度推广怎么登陆
  • 福州网站seo推广优化建站abc网站
  • 电子商务网站建设管理答案公司网络推广方法
  • 网站制作过程中常见的问题网络销售培训学校
  • 湖滨区建设局网站南通关键词优化平台
  • 网站怎么做黑链接网络广告策划方案范文
  • 交易网站seo怎么做跨境电商平台有哪些?
  • 网站做产品的审核搜索引擎优化培训班
  • 影楼行业网站百度 seo 工具
  • 幸福人寿保险公司官方网站电子保单打印外链吧
  • 找人做网站都要提供什么做网站好的网站建设公司
  • 做村易通网站站长要收费吗枸橼酸西地那非片多长时间见效
  • 百度文章收录提交入口安阳seo
  • 酒店网站建设公司seo高级优化技巧
  • 怎么才能成功做网站怎么做好网络推广销售
  • 学校响应式网站模板下载怎么注册个人网站
  • 网站建设国内排行怎么联系百度客服人工服务
  • 做体彩网站怎么做拍照搜索百度识图
  • 网站建设与动态网页设计百度推广客服
  • 时时彩网站怎么建设的免费域名空间申请网址
  • 专业北京seo公司长沙seo招聘
  • 北京网站制作报价b2b电子商务网
  • 做网站 搞流量百度关键词推广工具
  • 做网站的基本要求汕头网站推广排名
  • 可以做设计兼职的网站网站建设培训
  • 西安网站推广助理免费培训课程
  • 重庆做网站建设的公司成都网站快速排名
  • 网站开发需要哪些文档写软文的app
  • 红黑网站模板百度搜索引擎优化的推广计划
  • 南昌网站建设方案软件外包企业排名