首页 > 公开课 > 人工智能 > 大数据分析、可视化与AI交互式数据挖掘

大数据分析、可视化与AI交互式数据挖掘

关于举办“大数据分析、可视化与AI交互式数据挖掘”

培训班的通知

各有关单位:

为增强企业竞争力,优化运营促进创新,深度挖掘数据为企业决策提供科学依据。同时助力广大职场精英把握时代脉搏,掌握前沿技术,在数字化时代提升综合能力。中培伟业精心打造了“大数据分析、可视化与AI交互式数据挖掘”培训课程。于2026年在全国部分城市举办公开课,诚邀您的参与,有关事宜如下:

一、培训背景

数字化转型浪潮下,数据已成为企业核心生产要素,多源数据的价值释放成为业务增长与决策优化的关键。当前企业普遍面临数据孤岛、分析效率低、价值挖掘不深等痛点,传统数据分析方式难以适配复杂业务场景,亟需系统的技术方法支撑数据从采集到应用的全流程落地。

随着大数据、可视化与AI技术的深度融合,市场对兼具实操能力与跨界思维的复合型数据人才需求持续增长。无论是职场从业者寻求技能升级,还是企业推进数字化人才培养,都需要通过系统学习掌握新一代数据挖掘工具、分析逻辑与决策思维,以适配数字化转型中的业务需求,提升核心竞争力。

二、培训对象

大数据系统研发工程师、大数据分析师、数据安全研发人员、大数据应用开发工程师、数据可视化工程师、数据科学研究等相关人员。

三、培训信息

培训形式:线下面授 + 同步直播

培训班次:

2026年6月28-30日 广州

2026年8月29-31日 西安

2026年10月24-26日 重庆

四、培训内容

培训共计3天,每天6小时,具体日程安排如下:

日程 主题 内容
第一天
上午
数据分析实战 第一讲 零基础学Python
1.Python背景
2.国内发展状况
3.基础语法
4.数据结构
5.绘图操作
6.特别针对向量计算模块
7.着重介绍Python在这方面的优势及用法
第二讲 数据分析方法论
1.讲解统计分析基础(统计学基本概念,假设检验,置信区间等基础)
2.结合数据案例说明其使用场景和运用方法
3.介绍数据分析流程和常见分析思路,同时结合案例进行讲解
第三讲 数据处理技法
1.从数据接入、数据统计、数据转换等几个方面进行讲解
2.数据接入包含接入MySQL、Oracle、Hadoop等常见数据库操作
3.数据统计包含Pandas包的具体用法和讲解
4.数据转换包含对数据集的关联、合并、重塑等操作
5.针对海量数据的情况下,介绍在Spark平台上的数据处理技术
6.结合真实环境进行操作讲解。
第一天
下午
数据挖掘理论及核心技术 第四讲 认识数据挖掘
1.数据挖掘基本概念
2.业务理解
3.数据理解
4.数据准备
5.建立模型
6.模型评估
7.模型部署各环节的工作内容及相关技术
8.结合业界经典场景,讲解数据挖掘的实施流程和方法体系
第五讲 Pandas进行数据预处理
1.数据合并
2.数据清洗(重复值、缺省值、异常值处理)
3.数据标准化(离差标准化、标准差标准化)
4.数据变换(哑变量转换、连续型数据离散化)
5.抽样、分区、样本平衡、特征选择
6.结合典型业务案例讲解其具体实现与应用场景,帮助学员掌握数据在建模前的清洗与特征构造思路
第二天
上午
 
 
大数据算法原理及案例实现(1)
第六讲 特征降维算法及Python实现
1.特征降维算法讲解
2.主要讲解主成分、LDA以及t-SNE原理
3.结合案例进行Python实现
4.针对海量数据情况下的应用场景,讲解实现思路和Python案例
第七讲 决策树算法及Python实现
1.决策树算法讲解
2.讲解ID3、C4.5、C5.0以及CART决策树算法的实现原理
3.结合案例进行Python实现
    第八讲 好莱坞百万级影评数据分析与电影推荐实现(实战部分):
1. 基于好莱坞百万级的影评数据,对数据进行建模、清洗、透视表操作。
2. 然后根据用户画像分析不同的用户喜好通过机器学习算法对不同性别、年龄阶段的用户进行定制化的电影推荐
3.最后把推荐的电影进行可视化的展示操作
 
 
 
 
 
第二天
下午
 
大数据算法原理及案例实现(2)
第九讲:航空公司客户价值分析(K-Means实战):
1. 基于航空公司客户的历史飞行数据,对数据进行清洗、属性规约、属性构造(构建LRFMC指标)
2. 然后根据LRFMC模型对客户进行特征分析
3. 通过K-Means聚类算法对不同价值的客户进行细分
4. 最后把客户群体的特征进行可视化展示,为不同价值的客户制定个性化营销策略
第十讲:机器学习神器:XGBoost 构建金融反欺诈模型
1. 细致讲解 XGBoost算法的核心思想与模型原理
2. 包括梯度提升框架、树结构优化、目标函数与正则化机制
3. 通过实际金融交易数据集案例,演示特征构建、模型训练与参数调优全过程
4. 讲解模型评估指标(AUC、KS 值、召回率、F1 等)在反欺诈系统中的应用意义
5. 结合Python与XGBoost库,完成从数据加载、特征处理、模型构建、评估到可视化的完整实战流程
 
 
 
 
 
 
 
 
 
第三天
上午
 AI对话式数据分析与挖掘实战 第十一讲:Pandas AI通过自然语言交互实现数据分析
1. 基于任意结构化数据集(如Excel、CSV),对数据进行清洗、数据转换、特征生成
2. 然后根据自然语言指令对数据进行探索性分析
3. 通过大型语言模型(LLM)自动生成并执行Python代码,对复杂数据关系进行深度洞察
4. 最后把分析结果和图表进行自动化可视化展示
第十二讲: ChatExcel(Excel AI处理方向)
1. 自然语言驱动的Excel表格智能处理(ChatExcel实战)实战部分:
2. 基于Excel/CSV表格数据,对数据进行清洗、格式转换、多表合并
3. 然后根据一句话指令对数据进行智能运算与统计,通过AI模型对复杂函数逻辑进行自动化生成与执行
4. 最后把交叉对比结果和数据透视进行即时可视化展示
第十三讲:Julius AI (对话式数据分析助手)
1. 核心功能:作为一个对话式数据分析助手,Julius AI允许用户通过上传数据文件(如 CSV、Excel)
2. 使用自然语言提问来执行复杂的数据操作、统计分析和可视化。它能够理解上下文,自动生成并执行 Python/R 代码,并以图表和文字洞察的形式返回结果
3.适用场景:快速的探索性数据分析(EDA)、即时数据洞察、非技术人员的数据查询
第三天
下午
数据分析可视化与AI生成数据分析报告
 
第十四讲:DeepSeek生成图表可视化主题描述
1. DeepSeek大模型驱动的自然语言图表生成与可视化方法论实战部分:
2. 基于结构化数据或分析结果,对图表需求进行自然语言描述。
3. 然后通过DeepSeek大模型的代码生成能力,自动生成并执行Python可视化代码(如基于Matplotlib、Plotly、Pyecharts等库)
4. 实现复杂图表的一键生成,对数据含义进行简洁表达与高效洞察
5. 最后把生成图表应用于数据分析报告或Web应用中进行可视化展示
第十五讲:全能AI智能体数据分析与报告撰写(Manus实战)
1. 基于多源异构数据(如网页内容、文件、API数据),对数据进行收集、整合、预处理
2. 然后根据用户需求对数据进行多维度分析
3. 通过AI智能体的多工具协作能力对特定业务问题进行深入研究与建模
4. 最后把分析结论、数据图表和研究报告进行专业化文档撰写与交付

备注:采用小班制教学,授课过程中,讲师会通过互动提问、组织小组讨论、即时答疑等形式,帮助学员迅速将所学转化为可落地的能力。

五、培训教师

➤ 刘老师 大数据分析领域专家

拥有十几年软件研发经验,十年企业培训经验,对Java、Python、区块链等技术领域有独特的研究,精通J2EE企业级开发技术。

Java方向:设计模式、Spring MVC、MyBatis、Spring、StringBoot、WebService、CXF并且对Java源码有深入研究。

Python方向:Python OOP、Mongodb、Django、Scrapy爬虫、基于Surprise库数据推荐,Tensorflow人工智能框架、人脸识别技术。

区块链方向:BitCoin、Solidity、Truffle、Web3、IPFS、Hyperledger Fabirc、Go、EOS。

➤ 郭老师 | 数据治理专家

国内数据治理专家、高级产品经理、优秀项目管理培训师,计算机专业硕士,曾任中国电信高级工程师,现任某信息技术公司产品及技术总监。上海软件协会高级讲师、上海软件协会考评员、共青团上海市委员会青年(大学生)职业训练营上海市政府指定讲师、浦东软件园高级讲师。18年+开发、设计经验,10年+数据治理培训/咨询经验,给多家上市公司企业研发团队做过培训或咨询业务,对企业数字化转型、数据治理、产品管理有着敏锐、独特的认知体系。

六、培训收益

1.掌握大数据分析全流程实操

2.熟练数据可视化工具与技巧

3.理解AI数据挖掘核心算法

4.具备交互式数据探索能力

5.建立数据驱动决策思维

6.学会多源数据整合方法

7.拓宽行业数据应用视野

8.提升职场数据技能竞争力

七、证书颁发

参加培训并通过考试的学员,将获得由工业和信息化部教育与考试中心统一颁发的《大数据挖掘技术(高级)》职业能力证书。证书长期有效,相关信息可随时登录中心官网查询。