模型预测笔记(三)：通过交叉验证网格搜索机器学习的最优参数

#调用网格搜索和决策树
from sklearn.model_selection import GridSearchCV
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import classification_report, roc_curve, auc
parameters = {'max_depth':[3, 5, 7, 9], 'min_samples_leaf': [1, 2, 3, 4]}# 选择两个超参数 树的深度max_depth和叶子的最小值min_samples_leaf

clf = GridSearchCV(DecisionTreeClassifier(), parameters, cv=3, scoring='accuracy')# 进行网格搜索得到最优参数组合
clf.fit(X_train, y_train) #通过有最优参数组合的最优模型进行训练

print('最优参数：', clf.best_params_)
print('验证集最高得分：', clf.best_score_)
# 获取最优模型
best_model = clf.best_estimator_
print('测试集上准确率：', best_model.score(X_test, y_test))

# 得到预测概率
y_prob_DT = clf.predict_proba(X_test)[:, 1]

# 得到预测标签
y_pred_DT = clf.predict(X_test)

# 得到分类报告
print(classification_report(y_pred = y_pred_DT, y_true = y_test))

# 绘制ROC图
fpr, tpr, threshold = roc_curve(y_score = y_prob_DT, y_true = y_test)
print("AUC值", auc(fpr, tpr))
plt.plot(fpr, tpr,"r-")
plt.plot([0, 1], [0, 1],"b-")
plt.xlable("FPR")
plt.ylable("TPR")
plt.title("ROC Curve")

# 输出结果文件
result = pd.DataFrame()
result["load_ID"] = pd.read_csv("***.csv")["**ID"]
result["predict_labels"] = y_pred_DT
result.to_csv("result.csv", index = False)

# 特征重要性评估
best_DT = clf.best_estimator_
best_DT.fit(X_train, y_train)

# 重要性绘制
plt.figure(figsize(8, 6))
pd.Series(best_DT.feature_importances_, index=X_train.columns).sort_values().plot(kind="barh")

vue如何对node_modules源码进行修改，对第三方依赖包源码修改

方法用patch-package给node_module中的包打补丁，解决修改源码的问题使用 1、下载 patch-package 包：npm install

leetcode算法题459——重复的子字符串 KMP算法实现

参考资料

图像标注工具 ground truth annotation and labeling

几种简单的图像和视频标注工具对于计算机视觉的研究者来说，图像和视频的标注是一项基础但繁重的工作。通常大家都会写一段Matlab小程序来完成基本的图像标注任务，当然是在标注需求比较简单的情况下。下面给大家介绍几种简单易用的图像和视频标注工具

Ubuntu16.04 安装显卡驱动及CUDA

doris配置hive的catalog

创建hive的catalog CREATE CATALOG hive PROPERTIES

文件相关

一一一一一

leetcode,牛客简单题(2)

如何利用tf.keras 实现深度学习？

tf.keras是TensorFlow 2.0的高阶API接口，为TensorFlow的代码提供了新的风格和设计模式，大大提升了TF代码的简洁性和复用性，官方也推荐使用tf.keras来进行模型设计和开发。

Rotors simulator ETH-ASL的无人机仿真系统安装指南

WebService

WebService是什么？ Webservice的一个最基本的目的就是提供在各个不同平台的不同应用系统的