当前位置:   article > 正文

Interview之AI:人工智能领域岗位求职面试—人工智能算法工程师知识框架及课程大纲(AI基础之数学基础/数据结构与算法/编程学习基础、ML算法简介、DL算法简介)来理解技术交互流程_ai算法工程师要学什么

ai算法工程师要学什么

Interview之AI:人工智能领域岗位求职面试—人工智能算法工程师知识框架及课程大纲(AI基础之数学基础/数据结构与算法/编程学习基础、ML算法简介、DL算法简介)来理解技术交互流程

目录

剖析自己

1、个人能力角度

2、选择公司角度

一、AI基础

1、数学基础——高等数学、概率统计、线性代数

T1、微积分、统计学/概率论、线性代数

T2、数据分析、概率论、线性代数及矩阵、凸优化

2、数据结构与算法——查找、哈希、表达式、字符串、堆与栈、排序、高级算法、链表、数组、动态规划、遍历

3、编程学习基础——编程语言/工具/环境、容器/函数/常用库

T1、编程语言/工具/环境

T2、容器/函数/常用库

二、ML算法简介

1、基于处理问题进行算法分类——分类问题、回归问题、聚类问题、推荐系统、模型融合常用的算法

2、机器学习概述

1、特征工程

2、回归算法

3、决策树、随机森林和提升算法

4、SVM

5、聚类算法

6、EM算法

7、贝叶斯算法

8、隐马尔科夫模型

9、LDA主题模型

三、DL算法简介

1、Tensorflow基本应用(安装、基本概念、基本函数、执行流程、Keras、实现回归算法)

2、深度学习概述—BP、RBF、CNN、RNN、GAN等


剖析自己

1、个人能力角度

确定自己应具备的能力:以结果为导向的思维,看职位要求让做什么,自己会会什么,还差哪些?

职位条件

目前能力

还差的能力

ML算法工程师

熟悉python/R、SQL等语言。

精通任何一种面向对象编程语言,如python,c/c++或java;

熟悉hadoop生态圈的常用工具(如spark,pig等);

DL算法工程师

具有较强编程能力,熟练使用至少一种脚本语言(python/shell等),有C++开发经验,

熟悉linux开发环境,有MPI、CUDA经验更佳;

至少精通一种开源框架Tensorflow、Caffe、MxNet、Theano、Torch;

有Deep Learning实战经验,熟悉常用框架,有多机多卡分布式集群开发部署经验者优先;

CV算法工程师

具有较强编程能力,熟练使用至少一种脚本语言(python/shell等),有C++和java开发经验。

精通C/C++,有良好的编程规范;

熟悉linux开发环境。

熟悉caffe、 pytorch,、tensorflow经验更佳;

有丰富的图像处理经验,熟练掌握opencv等库的使用;

有图像检测、数字信号处理、统计机器学习、深度学习项目经验者优先;

有扎实的数学基础和较深厚的图像处理经验;

熟悉物体(人体、人脸、通用目标)检测、跟踪与识别的基本算法;

对模式识别、图像处理以及计算机视觉有较深入的理解,熟悉人脸检测/跟踪/识别、OCR、物体和场景识别、多目标跟踪、人体关键点检测等相关算法

NLP算法工程师

对文本算法(分类,聚类,语义分析,概率模型,相似度等)有深入的理解和应用经验。

有过文本反垃圾实践经验优先,有深度学习实践经验优先。

广告算法工程师

熟悉Python编程语言

熟练使用 Python / Java / C++(中的一项或多项)做开发

熟悉Linux开发环境

Tensorflow 等深度学习框架。

有大数据上的特征工程或模型开发(LR/FM/GBDT/DNN 不限) 经验

熟悉Hadoop/Spark/Storm等大规模分布式计算系统;

能够熟练使用 Spark 或 Hive SQL 进行数据处理,

2、选择公司角度

条件

选择标准

期望

年薪

兴趣

发展方向

职业规划

一、AI基础

1、数学基础——高等数学、概率统计、线性代数

T1、微积分、统计学/概率论、线性代数

微积分

  • 求导
  • 梯度
  • 偏微分
  • 积分

统计学/概率论

  • 推断统计学和概率论的基本概念
  • 高斯分布
  • 贝叶斯公式
  • 最小二乘法
  • 线性回归
  • 逻辑回归

线性代数

  • 向量
  • 向量空间
  • 向量投影
  • 矩阵运算
  • 特征值分解
  • SVD分解

T2、数据分析、概率论、线性代数及矩阵、凸优化

1.数据分析a. 常数e
b. 导数
c. 梯度
d. Taylor
e. gini系数
f. 信息熵与组合数
g. 梯度下降
h. 牛顿法
2.概率论a. 微积分与逼近论
b. 极限、微分、积分基本概念
c. 利用逼近的思想理解微分,利用积分的方式理解概率
d. 概率论基础
e. 古典模型
f. 常见概率分布
g. 大数定理和中心极限定理
h. 协方差(矩阵)和相关系数
i. 最大似然估计和最大后验估计
3.线性代数及矩阵a. 线性空间及线性变换
b. 矩阵的基本概念
c. 状态转移矩阵
d. 特征向量
e. 矩阵的相关乘法
f. 矩阵的QR分解
g. 对称矩阵、正交矩阵、正定矩阵
h. 矩阵的SVD分解
i. 矩阵的求导
j. 矩阵映射/投影
4. 凸优化a. 凸优化基本概念
b. 凸集
c. 凸函数
d. 凸优化问题标准形式
e. 凸优化之Lagerange对偶化
f. 凸优化之牛顿法、梯度下降法求解

2、数据结构与算法——查找、哈希、表达式、字符串、堆与栈、排序、高级算法、链表、数组、动态规划、遍历

查找、哈希、表达式、字符串、堆与栈、排序、高级算法、链表、数组、动态规划、遍历

3、编程学习基础——编程语言/工具/环境容器/函数/常用库

T1、编程语言/工具/环境

编程语言:python/Java/C语言/C++
大数据相关:Hadoop/Spark
数据挖掘:Pandas、Numpy、scipy、Matplotlib
数据分析:R
交互式环境:ipython notebook

T2、容器/函数/常用库

1. 容器a. 列表:list
b. 元组:tuple
c. 字典: dict
d. 数组: Array
e. 切片
f. 列表推导式
g. 浅拷贝和深拷贝
2. 函数a. lambda表达式
b. 递归函数及尾递归优化
c. 常用内置函数/高阶函数
d. 项目案例:约瑟夫环问题
3. 常用库a. 时间库
b. 并发库
c. 科学计算库
d. Matplotlib可视化绘图库
e. 锁和线程
f. 多线程编程

ML算法简介

1基于处理问题进行算法分类——分类问题、回归问题、聚类问题、推荐系统、模型融合常用的算法

处理分类问题常用算法

逻辑回归(工业界常用)、支持向量机、随机森林、朴素贝叶斯(NLP中常用)、深度神经网络(视频、图片、语音等多媒体数据中使用)、决策树

处理回归问题常用算法

线性回归、普通最小二乘回归逐步回归、多元自适应回归样条

处理聚类问题常用算法

K均值、基于密度聚类、LDA

推荐系统的常用算法

协同过滤算法、FM

模型融合和提升的算法

Bagging、Adaboost、GBDT、GBRT、Stacking、Blending

2、机器学习概述

特征工程、回归算法、决策树、随机森林和提升算法、SVM、聚类算法、EM算法、贝叶斯算法、隐马尔科夫模型、LDA主题模型

1、特征工程

a. 特征抽取
b. 特征转换
c. 特征选择
d. 降维
f. NLP特征工程

2、回归算法

a. Linear Regression算法
b. Lasso Regression算法
c. Ridge Regression/Classifier算法
d. Elastic Net算法
e. Logistic算法
f. K-邻近算法(KNN)

3、决策树、随机森林和提升算法

a. 决策树算法: ID3、C4.5、CART
b. 决策树优化
c. Bagging和Boosting算法
d. 随机森林
e. Adaboost算法
f. GBDT算法
g. XGBoost
h. LightGBM

4、SVM

a. 线性可分支持向量机
b. 核函数理解
c. SMO算法
d. SVM回归SVR和分类SVC

5、聚类算法

a. 各种相似度度量介绍及相关关系
b. K-means算法
c. K-means算法优缺点及变种算法
d. 密度聚类
e. 层级聚类
f. 谱聚类

6、EM算法

a. 最大似然估计
b. EM算法原理讲解
c. 多元高斯分布的EM实现
d. 主题模型pLSA及EM算法

7、贝叶斯算法

a. 朴素贝叶斯
b. 条件概率表达形式
c. 贝叶斯网络的表达形式

8、隐马尔科夫模型

a. 概率计算问题
b. 前向/后向算法
c. HMM的参数学习
d. 高斯混合模型HMM

9、LDA主题模型

a. LDA主题模型概述
b. 共轭先验分布
c. Dirichlet分布
d. Laplace平滑
e. Gibbs采样详解
f. LDA与word2Vec效果比较

DL法简介

1、Tensorflow基本应用(安装、基本概念、基本函数、执行流程、Keras、实现回归算法

  • Tensorflow安装
  • Tensorflow基本概念
  • Tensorflow基本函数
  • Tensorflow执行流程
  • Tensorflow之上的工具库:Keras
  • 项目案例:基于Tensorflow实现回归算法

2、深度学习概述—BP、RBF、CNN、RNN、GAN等

      深度学习是实现机器学习的技术,同时深度学习也带来了机器学习的许多实际应用,拓展了AI的使用领域,本阶段主要从TensorFlow、深度学习概述、感知器神经网络、BP神经网络、RBF径向基神经网络、CNN卷积神经网络、RNN循环神经网、等方面讲解深度学习相关算法以及深度学习框架的使用。

  • 感知器神经网络
  • BP神经网络
  • RBF径向基神经网络
  • 卷积神经网络(CNN)
  • 循环神经网络(RNN)
  • 生成对抗网络(GAN、WGAN、EBGAN、DCGAN等)

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/weixin_40725706/article/detail/763821
推荐阅读
相关标签
  

闽ICP备14008679号