
01 基于sklearn的机械学习-机械学习的分类、sklearn的安装、sklearn数据集、数据集的划分、特征工程中特征提取与无量纲化
摘要 机器学习是人工智能的核心分支,通过算法从数据中自动学习规律,解决预测、决策等问题。根据数据是否包含标签,机器学习可分为监督学习(如分类、回归)、无监督学习(如聚类、降维)、半监督学习和强化学习。机器学习项目开发步骤包括数据收集、预处理、模型选择与训练、评估与优化。Scikit-learn是Python中流行的机器学习库,提供多种工具和算法,支持数据预处理、模型训练和评估。文中还介绍了Scikit-learn的安装、内置数据集(如鸢尾花、糖尿病、葡萄酒数据集)以及数据集划分方法(如train_test_
