使用Python进行机器学习:手写数字识别(基于KNN算法)
介绍:
在这个例子中,我们将使用Python的scikit-learn库来实现一个简单的K-最近邻(KNN)算法,用于识别手写数字(使用MNIST数据集)。KNN是一种基本的分类和回归方法,其中输入由最近邻的k个训练样本的多数类决定。
代码示例:
python
from sklearn import datasets
from sklearn.model_"www.czchenyang.com"selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score
# 加载数据集
digits = datasets.load_"www.msmhw.com"digits()
X = digits.data
y = digits.target
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 创建KNN分类器实例,设置邻居数为3
knn = KNeighborsClassifier(n_"www.xinnc.cn"neighbors=3)
# 训练模型
knn.fit(X_train, y_train)
# 预测测试集
y_pred = knn.predict(X_test)
# 计算准确率
accuracy = accuracy_score(y_test, y_pred)
print(f'Accuracy: "www.runservice.com.cn"{accuracy:.2f}')
解析:
使用sklearn.datasets加载MNIST手写数字数据集。
数据集被划分为特征(X)和目标(y),即图像像素和对应的数字标签。
数据集被进一步划分为训练集和测试集。
创建一个KNN分类器实例,并设置邻居数为3。
使用训练集数据训练模型。
使用测试集数据进行预测,并计算预测的准确率。
发布于:广东省