机器学习PAI初体验
背景
机器学习PAI是阿里云上的一个云产品,是一个云端机器学习平台。
初体验
准备工作
开通服务,略。
创建实验
从模型创建,选择“心脏病预测案例”模板。案例说明见:心脏病预测案例
运行实验
点运行。运行过程中,工作流的各个节点的状态会依次变成绿色的“完成对勾”状态。
在每个节点上,可以右键选择,查看数据。
部署在线服务
通过 PAI EAS部署成在线服务
心脏病预测案例
具体见心脏病预测案例。
数据挖掘流程:
graph TB
数据 --> 数据预处理
数据预处理 --> 机器学习模型训练
机器学习模型训练 --> 模型评估
模型评估 --> 数据预处理
模型评估 --> 离线/在线服务
整体实验流程
graph TB
数据源 --> 数据预处理
数据预处理--> 特征工程
特征工程--> 训练和预测
训练和预测--> 评估
结论:
- thalach(心跳数)对于是否发生心脏病影响最大。
- 性别对于是否发生心脏病没有影响。
模型效果:
通过本文档提供的14个特征,心脏病预测准确率可以达到百分之八十以上。模型可以用来做预测,辅助医生预防和治疗心脏病。