Python+计算机图像(视觉)处理
一、培训简述
课程中通过细致讲解,使学员掌握该技术的本质。具体收益包括:
1.掌握OpenCV的使用;
2.理解卷积神经网络;
3.掌握Tensorflow的使用;
4.掌握keras的使用;
5.通过各个应用场景的实际经典项目案例,深入解读计算机视觉技术的应用。
二、培训特色
本次培训从实战的角度对计算机视觉技术进行了全面的剖析,并结合实际案例分析和探讨计算机视觉技术的应用场景,给计算机视觉技术相关从业人员以指导和启迪。
三、培训时长
共计3天,每天6课时
四、培训大纲
(注:大纲还可根据需求进行调整)
覃棅丰
创业公司技术负责人。机器学习,深度学习领域多年一线开发研究经验,精通算法原理与编程实践。曾使用Tensorflow,Caffe,Keras等深度学习框架完成过多项图像,语音,nlp,搜索相关的人工智能实际项目,研发经验丰富。拥有两项国家专利,同时具有多年授课培训经验,讲课通熟易懂,代码风格简洁清晰。
人工智能相关工作经历:
上海希格斯网络科技有限公司 数据挖掘工程师
1.负责深度学习NLP算法的研究和实现。
2.负责搜索引擎的实现和优化。
上海索洛信息技术有限公司 高级算法工程师
1.负责深度学习图像算法的研究和实现。
2.负责深度学习语音算法的研究和实现。
人工智能相关项目经验:
人岗匹配项目 负责算法实现
● 收集了10万份JD。
● 基于Tensorflow平台使用LSTM+Attention算法。
● 使用JD训练职位推荐模型。训练好的模型可用于分析简历描述,并根据简历描述推荐一个或多个适合的职位。
项目关键词提取项目 负责算法实现
● 收集了10万份项目描述,并标记好项目中的关键词。
● 基于Tensorflow平台使用seq2seq模型。
● 从简历的项目描述中提取出该项目中的重点词汇。可用于优化简历项目搜索结果。
人才搜索引擎项目 负责搜索引擎的实现和优化
● 搭建简历搜索引擎服务。
● 完成学校名,专业,公司,行业等模块的搜索策略
● 完成搜索结果高亮服务。
● 修改搜索bug优化搜索算法。
宠物脸识别项目 负责数据处理,算法实现
● 收集了5万张狗/猫的照片,并标记好它们脸部的区域。
● 在Linux下基于Caffe平台使用Faster-rcnn实现狗/猫脸检测算法。
● 推出了一款在线小游戏,用户上传自己家狗/猫的照片,服务器接收到照片之后用训练好的模型检测照片中狗/猫的脸,并把狗/猫的脸框出来,给它们的长相打一上个分数,再把处理后的照片反馈给用户。
宠物品种识别项目 负责数据处理,算法实现
● 收集了19种猫和27种狗的照片,共3万多张,并做好分类标签。
● 基于Caffe平台使用AlexNet,GoogleNet以及自己设计的网络实现宠物品种分类算法。
● 推出了一款在线小游戏,用户上传自己家狗/猫的照片,服务器接收到照片之后用训练好的模型检测照片中狗/猫的品种,不同宠物的品种会对应不同明星的脸,再把与宠物品种相似的明星脸反馈给用户。
宠物叫声情感分类项目 负责数据处理,算法实现
● 收集了1万6千条狗叫声,分成8个类别。
● 基于Tensorflow平台使用CNN,LSTM实现狗叫声情感分类算法。
● 将训练好的模型放到嵌入式设备中,实时判断当前场景是否有狗叫声,有狗叫声的话是属于什么分类。
课程中通过细致讲解,使学员掌握该技术的本质。具体收益包括:
1.掌握OpenCV的使用;
2.理解卷积神经网络;
3.掌握Tensorflow的使用;
4.掌握keras的使用;
5.通过各个应用场景的实际经典项目案例,深入解读计算机视觉技术的应用。
二、培训特色
本次培训从实战的角度对计算机视觉技术进行了全面的剖析,并结合实际案例分析和探讨计算机视觉技术的应用场景,给计算机视觉技术相关从业人员以指导和启迪。
三、培训时长
共计3天,每天6课时
四、培训大纲
| 日程 | 培训模块 | 培训内容 |
| 第一天 上午 |
OpenCV使用 | 1.安装opencv 2.图像处理基础 3.图像运算和转换 4.图像平滑处理 5.图像梯度 6.图像边缘检测 7.图像金字塔 8.人脸检测和识别 |
| 第一天 下午 |
卷积神经网络介绍 | 1.CNN架构 2.卷积计算 3.卷积的步长 4.池化 5.Padding 6.MNIST网络结构介绍 |
| 第二天 上午 |
Tensorflow使用 | 1.深度学习框架介绍 2.Tensorflow安装 3.Tensorlfow基础知识 4.Tensorflow线性回归 5.Tensorflow非线性回归 6.Mnist数据集合Softmax讲解 7.使用BP神经网络搭建手写数字识别 8.交叉熵(cross-entropy)讲解和使用 9.过拟合,正则化,Dropout 10.各种优化器Optimizer 11.改进手写数字识别网络 12.卷积神经网络CNN的介绍 13.使用CNN解决手写数字识别 |
| 第二天 下午 |
keras使用 | 1.实现线性回归 2.实现非线性回归 3.MNIST数据集以及Softmax介绍 4.MNIST分类程序 5.交叉熵的应用 6.Dropout应用 7.正则化应用 8.优化器介绍及应用 9.CNN应用于手写数字识别 10.cifar-10图片分类 11.模型的保存和载入 12.绘制网络结构 |
| 第三天 上午 |
图像识别项目 | 1.介绍Google图像识别模型Inception-v3 2.使用Inception-v3做图像识别 |
| 猫狗分类项目 | 1.图像数据预处理 2.猫狗分类-简单CNN 3.猫狗分类-VGG16-bottleneck 4.猫狗分类-VGG16-Finetune |
|
| 验证码识别项目 | 1.多任务学习介绍 2.验证码识别项目 |
|
| 第三天 下午 |
目标检测项目 | 1.目标检测任务介绍 2.RCNN/Fast-RCNN/Faster-RCNN算法介绍 3.YOLO算法介绍 4.SSD算法介绍 5.目标检测项目实战 |
| 目标分割项目 | 1.目标分割任务介绍 2.全卷积网络 3.双线性上采样 4.特征金字塔 5.Mask RCNN算法介绍 6.目标分割项目实战 |
|
| 图像风格迁移项目 | 1.图像风格迁移介绍 2.图像风格迁移项目实战 |
|
| GAN项目 | 1.生成式对抗网络GAN介绍 2.生成式对抗网络GAN项目实战 |
覃棅丰
创业公司技术负责人。机器学习,深度学习领域多年一线开发研究经验,精通算法原理与编程实践。曾使用Tensorflow,Caffe,Keras等深度学习框架完成过多项图像,语音,nlp,搜索相关的人工智能实际项目,研发经验丰富。拥有两项国家专利,同时具有多年授课培训经验,讲课通熟易懂,代码风格简洁清晰。
人工智能相关工作经历:
上海希格斯网络科技有限公司 数据挖掘工程师
1.负责深度学习NLP算法的研究和实现。
2.负责搜索引擎的实现和优化。
上海索洛信息技术有限公司 高级算法工程师
1.负责深度学习图像算法的研究和实现。
2.负责深度学习语音算法的研究和实现。
人工智能相关项目经验:
人岗匹配项目 负责算法实现
● 收集了10万份JD。
● 基于Tensorflow平台使用LSTM+Attention算法。
● 使用JD训练职位推荐模型。训练好的模型可用于分析简历描述,并根据简历描述推荐一个或多个适合的职位。
项目关键词提取项目 负责算法实现
● 收集了10万份项目描述,并标记好项目中的关键词。
● 基于Tensorflow平台使用seq2seq模型。
● 从简历的项目描述中提取出该项目中的重点词汇。可用于优化简历项目搜索结果。
人才搜索引擎项目 负责搜索引擎的实现和优化
● 搭建简历搜索引擎服务。
● 完成学校名,专业,公司,行业等模块的搜索策略
● 完成搜索结果高亮服务。
● 修改搜索bug优化搜索算法。
宠物脸识别项目 负责数据处理,算法实现
● 收集了5万张狗/猫的照片,并标记好它们脸部的区域。
● 在Linux下基于Caffe平台使用Faster-rcnn实现狗/猫脸检测算法。
● 推出了一款在线小游戏,用户上传自己家狗/猫的照片,服务器接收到照片之后用训练好的模型检测照片中狗/猫的脸,并把狗/猫的脸框出来,给它们的长相打一上个分数,再把处理后的照片反馈给用户。
宠物品种识别项目 负责数据处理,算法实现
● 收集了19种猫和27种狗的照片,共3万多张,并做好分类标签。
● 基于Caffe平台使用AlexNet,GoogleNet以及自己设计的网络实现宠物品种分类算法。
● 推出了一款在线小游戏,用户上传自己家狗/猫的照片,服务器接收到照片之后用训练好的模型检测照片中狗/猫的品种,不同宠物的品种会对应不同明星的脸,再把与宠物品种相似的明星脸反馈给用户。
宠物叫声情感分类项目 负责数据处理,算法实现
● 收集了1万6千条狗叫声,分成8个类别。
● 基于Tensorflow平台使用CNN,LSTM实现狗叫声情感分类算法。
● 将训练好的模型放到嵌入式设备中,实时判断当前场景是否有狗叫声,有狗叫声的话是属于什么分类。

京公网安备11010602005427号