一、机器学习工程师项目简介
机器学习工程师是指采用人工智能技术,开发人工智能(A I)机器并使其学习和应用知识的高级程序员 ,能够针对监控生产系统中的数据产品的具体问题快速反应。本次课程安排及考试内容符合工信部教考中心机器学习工程师等级考试项目要求 ,适用于大数据产业从业人员和预就业人员 ,在大数据采集、大数据技术和大数据应用等领域。
课程涉及Python 编程基础、Python 数据分析与应用、 Python 机器学习实战、 Python 数据可视化、深度学习原理及编程实现,应用行业涉及互联网、政府、电商和农业等大数据相关行业。
机器学习工程师主要分有三个级别 ,初级、 中级和高级,每个等级面向对象和考试内容不一样。初级首要面向事务数据分析,为机器学习领域的初级 岗位,需要懂得数据需求,能收集重要的数据和必备的信息。 中级分为数据挖 掘和大数据方向,为机器学习领域的中级岗位,理解问题的痛点, 明白如何用机器学习方法看待商业问题。高级为数据科学,归于机器学习领域的高级岗位 ,具备从模型中攫取价值的能力 ,明白模型的最终目的是产生商业价值,理解经 典模型的基本调参 ,可以解释分析模型的输出结果,其相关岗位多为上市、 国企的大型企业的招聘岗位。
二、能力标准
1、机器学习工程师(初级)
需要掌握 Python 编程基础、 Python 常用数据分析及处理工具 numpy、pandas、scikit-learn ,能以Python 作为工具 ,基本解决项目中的技术问题。能够理解业务目标 ,并能将业务目标初步转化为机器学习应用问题 ,能结合具体技术进行初步目标实现。适合政府、金融、 电信、零 售等行业前端业务及从事市场、管理、财务、供应咨询等职位的相关人员。
2、机器学习工程师(中级)
一年以上机器学习技术的应用工作经验 ,或已获得机器学习工程师(初级)证书。掌握 Python 编程基础; Python 常用数据分析 及处理工具numpy、 pandas、 matplotlib、scikit-learn; Python 数据 可视化 、 机器学习 、常规案例应用,能够将业务目标准确转化为 Python技术与应用目标 ,在机器学习项目的需求分析、方案设计及代码实现中,按时保质交付有实效、有创新、有智慧的机器学习项目 ,积极探索,勇于实践新理论。适合政府、金融、 电信、零售、互联网、电商、医学等行业专门从事机器学习应用的人员。
3、机器学习工程师(高级)
三年以上机器学习技术的应用工作经验 ,或已获得机器学习工程师(中级)证书。掌握Python 编程基础; Python常用数据分析及处理工具numpy、 pandas、 matplotlib、scikit-learn; Python数据可视化、机器学习 原理、多行业多领域Python技术应用、深度学习、典型人工智能应用 ,能充分理解业务目标 ,并将业务目标精准转换、拆分为具体技术任务;具有超强数据规划能力 ,不仅能自主完成各环节任务还能带领机器学习团队完成大型项目 ,为企业生产赋能。适合政府、金融、电信、零售、互联网、电商、 医学等行业机器学习应用资深人员。
三、课程内容
初级:
阶段 | 课程 | 知识模块 |
前置知识 |
编程基础 | 准备工作 |
字符串操作 | ||
列表及字典操作 | ||
程序流程控制语句 | ||
函数与面向对象编程 | ||
文件基础与内置模块 | ||
常用库应用 | 概述 | |
数组创建 | ||
数组索引 | ||
通用函数与文件读写 | ||
数据准备 |
数据处理 | 数据检验 |
趋势度量与分布及数据特征分析 | ||
数据清洗 | ||
数据标准化、离散化 | ||
独热编码与数据合并 | ||
分组聚合 | ||
ETL数据整合 | ETL工具与环境配置 | |
数据输入与生成 | ||
组件操作 | ||
字符串操作、分组、选择与拆分 | ||
计算器与增加序列 | ||
数据连接与单变量统计 | ||
公式与变量 | ||
迁移和装载 | ||
工程转换与邮件发送 | ||
数据检查 | ||
数据分析 |
数据可视化 | Matplotlib绘图 |
Seaborn绘图基础、图表 | ||
Pyecharts图表 | ||
供应链销售数据分析 | ||
自热食品营销分析 | ||
谷物营养成分分析 | ||
上市企业利润数据分析和可视化 | ||
机器学习算法 | 机器学习绪论 | |
性能度量 | ||
回归分析 | ||
决策树算法介绍 | ||
泰坦尼克号生还者预测 | ||
人工神经网络介绍 | ||
网络训练实现 | ||
性能评价与神经网络实现 | ||
最近邻算法 | ||
朴素贝叶斯分类 | ||
聚类分析 | ||
支持向量机 | ||
基于用户的协同过滤推荐 | ||
基于流行度的推荐 | ||
时间序列 | ||
项目实战 | 教育平台的线上课程智能推荐 | 教育平台的线上课程智能推荐 |
职业技术考核 | 机器学习工程师(初级)职业技术考试 |
中级:
阶段 | 课程 | 知识模块 |
必备技能 |
Python特征工程实战 | 特征工程的概念 |
数据预处理 | ||
特征构建 | ||
特征选择 | ||
降维与特征转换 | ||
特征学习 | ||
案例分析:表情识别 | ||
课程配套数据、代码及PPT | ||
scikit-learn机器学习算法实现 | 使用scikit-learn构建模型 | |
课程配套资料下载 | ||
Python数据预处理 | 数据预处理 | |
配套资料下载 | ||
职业技术考核 | 机器学习工程师(中级)职业技术考试 |
高级:
阶段 | 课程 | 知识模块 |
环境管理 |
技术环境配置 | Python环境配置 |
Scala搭建 | ||
安装虚拟机与Java | ||
Hadoop集群部署模式与固定IP | ||
Hadoop集群配置与启动 | ||
Hive安装配置 | ||
Spark安装部署 | ||
搭建Spark开发环境 | ||
数据准备 | 数据标注 | 数据标注概述 |
数据存储、编码方式与标注工具 | ||
数据标注平台与文件格式 | ||
文本数据标注 | ||
语音数据标注 | ||
图像数据标注基础与分类 | ||
物体检测实战 | ||
语义分割、实例分割与描点标注实战 | ||
数据仓库 | Hive表格创建 | |
Hive查询与内置函数 | ||
工程创建与数据导入 | ||
数据统计分析 | ||
自定义函数 | ||
查询优化 | ||
综合案例:房价数据统计分析 (1)数据探索与数值统计 (2)销售额统计与分析 | ||
算法实现 |
机器学习进阶算法 | 半监督学习与强化学习 |
集成学习 | ||
综合案例:网络入侵用户自动识别 (1)背景分析与数据预处理 (2)模型训练与预测 | ||
深度学习框架 | MindSpore框架基础 | |
MindSpore构建线性模型 | ||
MindSpore手写数字识别-数据加载与转换 | ||
MindSpore手写数字识别-模型训练与预测 | ||
综合案例:问政留言分类 (1)重复值删除与文本预处理 (2)分词与构建word2vec词向量 (3)词向量提取 (4)模型搭建 (5)模型训练与预测 | ||
综合案例:脑PET图像分析和疾病预测 (1)图像读取与增强 (2)模型介绍与定义 (3)模型训练与应用 | ||
卷积神经网络 | ||
PyTorch实现卷积神经网络 | ||
PyTorch实现循环神经网络 | ||
PyTorch实现手写数字识别 | ||
综合案例:基于textCNN的公众健康问句分 类 (1)背景分析与数据探索 (2)文本预处理 (3)获取词向量矩阵 (4)模型构建与训练 | ||
综合案例:基于深度学习的花卉智能识别 (1)数据爬取 (2)数据探索与处理 (3)模型训练与预测 | ||
综合案例:基于PyTorch实现VGG网络猫狗 大战 (1)数据划分与预处理 | ||
(2)模型训练与预测 | ||
分布式计算框架 | 架构及原理 | |
RDD常用算子 | ||
文件读取与时长统计 | ||
创建DataFrame | ||
DataFrame API操作 | ||
数据保存与DataSet操作 | ||
分布式流式处理框架 | ||
编程模型 | ||
图创建方式与图缓存管理 | ||
图顶点与边转换 | ||
图结构转换与图关联聚合操作 | ||
MLlib机器学习算法库与数据标准化 | ||
回归、分类与聚类模型 | ||
关联规则、协同过滤算法与模型评价 | ||
综合案例:热门博文实时推荐 (1)Streaming概述与DStream操作 (2)实时更新热门博文 | ||
综合案例:餐饮大数据智能推荐 (1)数据探索与处理 (2)算法原理与建模 (3)菜品推荐 | ||
综合案例:招聘网站数据分析 (1)案例背景与数据存储 (2)数据探索与中文分词 (3)数据预处理与特征转换 (4)模型构建与词云图绘制 | ||
综合案例: P2P信用贷款风险分析 (1)案例背景与数据导入 (2)数据探索分析 (3)特征构建 (4)数据预处理与模型构建 | ||
职业技术考核 | 机器学习工程师(高级)职业技术考试 |
四、报考条件
初级:无要求 ,皆可报考。
中级:(满足其中一个条件即可)
1.获得初级证书。
2.年满18周岁,具备高中以上学历,工作年限满1年
高级:(满足其中一个条件即可)
1.获得中级证书。
2.年满20周岁以上,工作年限满2年
3.年满20周岁以上,具备大专及以上学历
五、考试方式
考试方式分为线下考试站点或线上考试系统统考两种方式,考试形式为上机答题,闭卷。
考试题型:
初级: 120 分钟 ,单选题+多选题+判断题+操作题+简答题 ,上机答题。
中级: 120 分钟 ,单选题+多选题+判断题+操作题+简答题 ,上机答题
高级: 120 分钟 ,单选题+多选题+判断题+操作题+简答题 ,上机答题。
六、成绩评分
考试最终成绩满分为100分,成绩80-100分为优秀;成绩60-79分
为合格;成绩60分以下为不合格。
七、证书颁发
学员经考核合格,由工业和信息化部教育与考试中心颁发机器学习工程师职业技术证书,证书可登录国家工信部教育与考试中心官网查询。
证书样本:

八、官方指定报名渠道www.aigc.cn,详情可咨询:
必须备注:机器学习工程师
