新闻动态|RAG&CoT为上市IT软件公司推出深度技术课程
分类:网校动态日期:2024-09-01 18:19:19人气:
课程简介
本课程深入讲解大语言模型(LLM)领域的两项前沿技术:RAG(检索增强生成)和Chain of Thought(CoT)。本课程结合理论与实践,详细介绍RAG和CoT技术的基本原理、应用场景、技术实现方法以及最新研究进展,帮助学生全面掌握这些技术的核心要点。
RAG技术部分将涵盖从入门到高级的全方位内容,包括RAG的基本概念、工作流程、实际应用和高级技术。通过实际操作,学生将学习如何从零开始搭建RAG系统,掌握RAG在不同应用场景下的高级实现方法。
思维链技术部分将重点讲解思维链的基本原理、提示方法、应用场景和增强方法。通过具体的案例分析,学生将深入了解思维链技术在算术推理和常识推理中的应用,并学习如何在小模型中迁移思维链推理能力。
培训时间
共2天,每天6小时,支持在线或离线。
课程目标
掌握RAG技术的基本原理和工作流程,理解RAG(Retrieval-Augmented Generation)的基本概念和重要性。熟悉RAG的工作流程,包括查询生成、检索、重排和生成四个主要步骤。具有构建和优化RAG系统的能力。了解从头开始构建RAG系统的环境配置和必要的工具安装。掌握先进的RAG 技术,例如查询理解、查询路由、索引优化、重新排序策略和生成模型优化。它可以在实际应用中优化RAG系统,提高检索和生成结果的质量。深入了解CoT技术及其应用。了解CoT技术的基本原理和发展历史。掌握不同的思维链提示方法,如零样本思维链提示、多模态思维链提示。了解思维链技术在算术推理和常识推理中的应用场景和具体实现方法。掌握思想链技术的增强方法,学习Graph-of-Thought(GoT)和自动思想链生成(Automated CoT Generation)的基本原理和实现方法。探索如何通过指令调优将大型模型中的思维链推理能力迁移到小型模型上,以在资源受限的环境下实现复杂的推理。提高学生在人工智能技术领域的研发能力。通过实验和案例分析,学生将学习在各种数据集上进行实验设置和性能评估。了解并掌握最新的LLM/大模型研究成果和前沿技术,增强在实际项目中的应用能力。提高学生人工智能系统开发和优化的综合能力,推动人工智能领域技术团队的创新和进步。
客户反馈
部分授课课件
部分课后测试题
课程大纲内容
一、RAG技术
1. RAG启示
RAG概念定义及背景介绍:RAG(检索增强生成)的基本概念及其在自然语言处理中的重要性。应用场景:RAG在信息检索、问答系统等方面的应用示例。 RAG工作流程及示例工作流程介绍:RAG的基本工作流程包括四个主要步骤:查询生成、检索、重排和生成。具体示例:详细展示了RAG模型从查询到结果生成的整个过程。从头开始搭建RAG实用环境配置:从头开始搭建RAG系统的环境配置和必要的工具安装。实践步骤:逐步指导学生搭建一个简单的RAG系统,涵盖数据预处理、模型训练和结果生成。提供RAG相关代码示例和资源链接,供学生参考和练习。 2.高级RAG技术讲解
Query 理解语义分析:深入分析Query 的语义理解及其对检索结果的影响。 Query优化:如何通过优化Query来提高搜索结果的准确性。查询路由策略:不同查询路由策略的比较及其在实际应用中的优缺点。路由实现:详细讲解Query路由的实现方法及其在RAG系统中的应用。 Indexing索引结构:常见索引结构(如倒排索引、哈希索引等)的原理及应用。索引优化:如何通过索引优化来提高检索速度和准确性。查询检索算法:常见检索算法(如BM25、向量检索等)原理及比较。实际应用:不同检索算法在实际RAG系统中应用的案例分析。重新排序(Rerank) 重新排序策略:介绍不同的重新排序策略及其对生成结果的影响。重排序实施:如何在RAG系统中实施有效的重排序策略并提高结果的相关性。 Generation(生成)生成模型:常见生成模型(如GPT、T5等)的原理及其在RAG中的应用。生成优化:如何通过优化生成模型来提高结果的流畅性和准确性。评估与框架评估方法:RAG系统评估的常用方法及其优缺点。框架介绍:主流RAG框架(如Haystack、FAISS等)对比及使用指南。 RAG2.0、AgentRAG2.0概念:RAG2.0的新特性及其在实际应用中的优势。 Agent技术:如何将Agent技术融入到RAG系统中,提高系统的智能化水平。 3.RAG的实际应用
RAG基本流程详细介绍了RAG系统的基本工作流程,包括查询生成、检索、重排、生成等步骤。查询理解通过具体案例展示了查询理解在RAG系统中的重要性及其实现方法。查询路由分析了不同查询路由策略的应用场景及其对系统性能的影响。索引展示了索引结构在实际RAG系统中的应用及其对检索效果的影响。查询检索通过实际操作演示了不同检索算法在RAG系统中的应用和效果比较。 4. RAG进阶实践
配置合适的文档解析工具详细介绍了如何选择和配置适合RAG系统的文档解析工具,以提高系统性能。训练更智能的分割模型深入解释了如何训练和优化分割模型以提高文档分割的准确性和效率。定制更强的Embedding模型如何通过定制Embedding模型来提高RAG系统的语义理解和检索能力。 《微调你自己的LLM》详细介绍了微调LLM的步骤和技巧,以提高生成结果的质量和相关性。高级RAG技术实现&高级RAG流水线展示了一些高级RAG技术的实现方法及其在实际应用中的效果。高级RAG 管道设计:如何设计和实现高效的RAG 管道以提高系统性能。 Agentic RAGAgentic RAG概念:Agentic RAG的基本原理及其在实际应用中的优势。实际应用:展示Agentic RAG在不同应用场景下的具体实现和效果。 GraphRAG GraphRAG概念:GraphRAG的基本原理及其在实际应用中的优势。实际应用:展示GraphRAG在不同应用场景下的具体实现和效果。
二、思维链CoT技术
1.思维链技术概述
基本概念介绍了思维链技术的基本原理和主要用途,及其在自然语言处理中的重要性。发展历史回顾思维链技术的发展历史,分析其在自然语言处理中的应用以及未来的发展趋势。 2.思维链提示法
Zero-Shot CoT 探索如何在没有示例的情况下通过自然语言提示引导模型逐步推理。多模态思维链提示(Multimodal CoT)结合文本、图像等多模态信息,提高推理精度和收敛速度。 3、思维链应用场景
算术推理展示了模型如何在算术推理任务中使用思维链方法来提高解决多步骤数学问题的能力。常识推理分析了思维链在常识问答任务中的应用,并讨论了其在解决复杂常识推理问题中的表现。 4、思维链技术的增强方法
Graph-of-Thought(GoT)介绍了如何通过图注意力网络(GAT)增强思维链的推理能力。 Automated CoT Generation 研究如何自动生成高质量的思维链提示,以提高模型在不同任务中的适用性。 5、小模型中思维链的迁移
模型对齐和迁移探索如何通过指令调优将大模型中的思维链推理能力迁移到小模型中,以在资源受限的环境中实现复杂的推理。 6 实验与案例分析
实验设置详细描述了各种数据集上的实验设置,包括GSM8K 和ScienceQA 数据集。性能评估分析了不同提示方法在各种推理任务中的表现,并提供了相关的实验数据和结果讨论。
讲师介绍
赵老师,资深大模型算法专家
北京邮电大学学士、硕士生,具有扎实的人工智能理论知识和丰富的实践项目经验。曾在字节跳动、中国银行担任算法工程师,现于某AI科技公司负责大型语言模型(LLM)实现项目。搭建了自主开发的训练框架,可适应ChatGLM12、Baichuan12、Qwen14B等主流开源模型的全参数/lora/Qlora微调,并支持各种训练指标可视化,方便对比实验;根据不同的业务需求构建了训练数据生成流程,进行训练数据处理;搭建了推理服务,并成功上线了基于自训练模型和推理服务与用户互动的APP。
学历
北京邮电大学硕士,人工智能专业北京邮电大学本科,计算机科学与技术专业过往课程讲授
Python编程与大数据应用ChatGLM等LLM的部署、训练与微调LangChain框架的深度解析与实践多模态处理与多模态大语言模型实践知识图谱技术在大数据中的应用大模型( LLM)数据预生产处理与特征工程LLM培训案例
中信银行:LLM驾驶课程内容:讲解LLM的基本原理、部署策略和微调技巧,帮助学生将LLM应用到实际项目中。培训效果:提高了学生对LLM的理解和实践能力,促进了项目的顺利进行。广汽如旗:AIGC大模型应用开发技能培训课程内容:为技术团队提供LLM模型与多模态AIGC的联合应用,并利用LLM能力辅助多模态生成。培训效果:提高了团队多模态生成技术水平,增强了公司在AIGC领域的竞争力。个人资质
精通Python和Go语言,有丰富的后端开发经验,涉及数据库、kafka、高并发处理等,在大型模型、NLP、RAG、CoT、语音识别(ASR)和语音评估(GOP),并基于kaldi和converter+transformer框架开发了相关服务。熟悉主流开源大语言模型的全参数/lora/Qlora微调技术,能够根据不同的业务需求进行定制化的训练数据处理。发表论文及发明专利
发表论文:《基于多模态大语言模型的智能客服系统研究》 《大模型在金融行业的应用与实践》 发明专利:一种用于金融风险预测的多模态大语言模型;基于LLM的智能语音交互系统。其他项目经验
PythonGo语言后端开发项目内容:负责后端开发,涉及数据库管理、kafka消息队列、高并发处理等技术。项目成果:提高系统稳定性和处理效率,满足高并发要求。语音评估(GOP)服务项目内容:基于kaldi框架训练语音评估模型,实现服务器端和手机端的本地化推理。项目成果:该服务已成功应用于用户APP中的中英文口语练习,实现自动化评分和评价。语音识别(ASR)服务项目内容:基于converter+transformer框架训练端到端模型,实现服务器端离线识别和流式识别。项目成果:该服务成功应用于客服系统和语音审核场景,提高了识别准确率和效率。
陈老师 大模型算法及应用开发资深专家
拥有10 年以上人工智能、数据科学、软件开发和系统架构经验,专注于人工智能生成模型(AIGC)、Python 和Java 语言。目前担任青岛AI研发及算法项目负责人。陈先生凭借深厚的人工智能技术背景和丰富的实践经验,致力于通过高质量的培训课程帮助学员提升人工智能专业技能。在科技行业大模型技术研发和实际落地方面拥有丰富的实践经验,主导和参与了多项科技行业大模型技术培训和辅导项目。
学历
2005.09—2008.07 天津大学,计算机科学与技术硕士2001.09—2005.07 山东大学,计算机科学与技术学士过往培训内容
大模型(LLM)技术原理与应用AIGC应用开发实战课程: 多模态大模型应用开发科技行业大模型具体实现案例分析金融科技行业数据分析与智能决策机器学习与神经网络基础与Python和Java编程语言高级应用培训案例
青岛人工智能:为公司研发团队提供大模型技术培训,内容涵盖大模型的基本原理、开发实践以及在技术和营销业务中的应用。苏泊尔:对IT/AI技术团队进行大模型技术培训,提高团队对大模型技术的理解、掌握和应用能力。工作专业经验
青岛人工智能:研发及算法负责人,负责相应大模型微调及应用开发。开发的产品包括:基于数字产业地图的数据流通服务平台;基于GLM大模型的智能客服应用平台;基于多模态大模型的动物智能诊断系统;基于大语言模型的AIGC案例学习平台; HR大型语言模型应用平台。负责大模型技术在教育培训中的应用和推广。 360数字:资深算法专家,根据实际业务需求,构建完整的生命周期风控模型产品体系,有效识别客户群体,降低风险;对内外部数据进行特征推导和挖掘,分析评估,选择最合适的、高性价比、有效的数据源,使模型产品在平衡业务需求的同时达到效果;负责项目中模型的研究、开发、部署、监控、维护、优化和迭代的全过程。北京正基基业教育科技有限公司:架构师和算法研发,负责公司AI+SaaS平台的技术架构设计和实施。北京运道科技有限公司:技术领先,引领智能物流及供应链金融平台的研发与应用。
林老师,大模型技术应用专家
16年工业数字化与智能技术背景,北航计算机仿真硕士,挪威工作两年,连续创业者,深谙金融企业数字化技术路线。
AIGC知名创新公司MoLook创始人兼CEO,曾任阿里云解决方案总监,负责基于云计算、AI、IoT的产品和解决方案积累、业务拓展以及生态建设。挪威软件公司Prediktor 前中国区负责人。 ICA联盟工作组组长、阿里云CIO学院讲师。阿里云产品销量连续三年突破亿,服务过陕煤、美孚、国家电网、南方电网、中国烟草、上海电气、宝钢、中工中大、东方希望等客户。
擅长AIGC的视觉和文本技术。作为多个AIGC项目的负责人,对AI技术在企业的落地有着丰富的经验和深刻的见解。
AI初创公司的LLM项目已由南新投资、欧冶、中烟等公司实施。视觉项目已在苏美达、三彩、雅戈尔等公司实施。
其中南信投资、欧冶、宏川等均为金融公司。林炬带领墨剑为这些公司提供了完整的AIGC解决方案,包括基础大模型、知识库RAG、工作流等技术。和应用程序实施。作为江苏最大的国有金融集团南新投资(首创投资),墨间帮助其打造AI大模型应用平台,打造智慧办公、数字化员工等应用,与其数字化系统紧密结合。作为一家贸易金融公司欧业,墨间帮助其构建了票据审核、知识库等金融服务应用。
林炬深谙云计算、大数据、物联网、人工智能等技术原理和路径,以及如何在企业落地。是技术实施企业实践的一面。作为互联网产品解决方案负责人,林菊参与过300多个企业数字智能化项目的规划和建设,其中大型项目30个,拥有丰富的实践经验。作为AIGC的创始人,他对人工智能技术及其在企业中的应用有着深刻的理解。
过往教学主题及培训内容
大模型技术基础大模型基本原理与架构主要大模型框架及技术应用大模型在金融行业的应用金融数据分析与建模风险控制与预测客户行为分析与推荐系统多模态内容分析多模态数据融合技术综合图像、文本和语音数据处理LLM 产品开发和培训案例
合作开发:金融风险预测系统作为外部核心技术参与金融科技公司的研发项目,开发了基于大模型的金融风险预测系统,成功提高了风险控制的准确性和效率。为公司技术团队提供大模型技术指导和培训,包括数据预处理、模型训练和优化等。 合作开发:客户行为分析与推荐系统主持开发基于多模态内容分析的客户行为分析系统为银行提供个性化推荐服务。对银行相关部门进行系统使用和大模型技术应用培训,促进新技术在实际业务中的落地。南信投资:金融大模型平台合作项目与南信投资合作开发金融大模型应用平台,推动大模型在金融行业的广泛应用。为内部技术人员提供专项培训,涵盖大模型开发和应用的各个方面。
孙老师,资深大模型算法专家
毕业于中国科学技术大学自动化系。他拥有20 多年的IT/AI 经验。曾服务过星展银行、瑞银、汇丰银行等大型银行客户以及IBM、华为、顺丰速运、毕马威等知名企业。 All in将于2023年启动生成式人工智能应用业务,专注于金融领域的人工智能咨询、系统实施和培训。精通生成式AI相关技术栈及应用系统设计与开发。
2023.10至今:生成式AI研发专家
持续跟踪国内外开源和闭源大型模型的发展,本地部署或通过API集成到系统中,熟悉GPT、Claude、Gemini、Llama、Mistral、Command R、GLM、Qwen、Deepseek、Moonshot、讯飞Spark、Ernie、Yi、MiniMax等模型可以根据金融行业不同的业务场景选择模型。
熟悉大量开源嵌入模型和向量数据库,如BGE、Jina、Nomic等系统嵌入模型和Qdrant、Milvus、Chroma、LanceDB、Fincore等向量数据库,并能提供选型建议
精通Langchain、Llamaindex、Langgraph等生成式AI应用开发框架,并能够根据金融行业业务场景进行选择和应用
研究了多个开源和闭源平台级产品,包括Coze、DSPy以及各模型厂商提供的在线聊天机器人和代理平台。
设计开发了多种生成式AI应用,从简单的多轮对话聊天机器人到RAG、Agent、Agentic Workflow、Vscode代码生成插件和浏览器插件;精通生成式AI应用系统架构设计和系统调优
部署稳定扩散模型进行文森图能力评估测试,持续跟踪国内外文森图模型和平台的发展,熟悉国内厂商的文森图平台和API。
在系统中部署并集成语音转文本和文本转语音模型,例如Whisper、EmotiVoice
开展多次大模型技术应用培训,包括针对金融行业IT团队的“AIGC大模型技术在金融领域的场景化应用”培训。
2017-2023,毕马威中国智能创新中心技术总监
成立毕马威中国智能创新中心,管理从设计、开发、交付、上线到运维的全流程,团队规模近500人。带领团队为公司内外部客户设计开发人工智能和大数据驱动的解决方案,围绕信用、风险、合规等业务领域构建知识库、算法模型和业务系统。服务的客户包括汇丰银行、平安集团、招商银行、太平洋保险、蚂蚁金服等国内外知名企业。
2001年-2014年,IBM,从技术开发到企业管理
作为技术团队负责人,带领团队进行应用系统设计、开发、测试、上线和运维;服务过的客户包括:电讯盈科、星展银行、国泰航空、瑞银、UPS、深圳空港物流园等。
用户评论
这个深度技术课程听起来很专业,对于我们这些IT行业的人来说是个大福利啊!
有12位网友表示赞同!
上市公司的课程肯定不便宜,但学到的东西值回票价就足够了。
有6位网友表示赞同!
RAG&CoT的深度技术课程,是不是意味着我可以晋升加薪的机会更多了呢?
有8位网友表示赞同!
深度技术课程是个好事情,但愿能真正学到点东西,别又是纸上谈兵。
有15位网友表示赞同!
IT行业竞争激烈,这种课程太及时了,我得赶紧报名。
有16位网友表示赞同!
深度技术课程对于新手来说太深奥了,希望有基础的人能更容易上手。
有12位网友表示赞同!
上市公司的课程质量肯定有保证,期待能提升自己的技术水平。
有7位网友表示赞同!
RAG&CoT的课程内容丰富吗?对于想要转行的人来说,这样的课程是不是太专业了?
有11位网友表示赞同!
深度技术课程是不是只有内部员工才能参加?外部的IT从业者怎么办?
有15位网友表示赞同!
深度技术课程听起来很有前景,但我担心自己跟不上了。
有8位网友表示赞同!
RAG&CoT这次推出的课程,对行业来说是件大事,期待看到效果。
有19位网友表示赞同!
上市公司的课程,价格可能不菲,但为了职业发展,我觉得值得投资。
有12位网友表示赞同!
深度技术课程内容太专业了,我得先去了解一下再决定报不报名。
有6位网友表示赞同!
RAG&CoT的深度技术课程,对于小白来说可能有点难度,但还是想挑战一下自己。
有9位网友表示赞同!
深度技术课程,对于想要成为行业专家的人来说,是个很好的机会。
有13位网友表示赞同!
上市公司的课程,质量肯定有保障,但价格方面还是让人有些犹豫。
有11位网友表示赞同!
RAG&CoT的深度技术课程,能否帮助我们更好地应对行业变革呢?
有9位网友表示赞同!
深度技术课程,希望是实用的,别学了一堆概念,实际工作中用不上。
有14位网友表示赞同!