課程簡介
本課程圍繞電商業(yè)務場景,探討AIGC與大模型在電商行業(yè)的應用。課程以互動交流為主,涵蓋大模型原理、提示詞設計、數(shù)據(jù)構造與清洗、模型技術選型、微調(diào)與優(yōu)化、強化學習及推理部署等關鍵內(nèi)容。通過案例分析和實戰(zhàn)討論,幫助學員深入理解并應用大模型技術優(yōu)化電商數(shù)據(jù)分析與報告生成流程。
目標收益
學員將掌握大模型相關核心技術,包括大模型提示詞優(yōu)化、數(shù)據(jù)處理、模型微調(diào)與強化學習等方法。通過深入的行業(yè)交流,了解最新的開源大模型生態(tài),提升在電商場景下的AI應用實踐能力,為業(yè)務智能化升級提供技術支持。
培訓對象
課程內(nèi)容
第一天-上午
1. 課程開場與AIGC綜述(0.5h)
大模型原理概述,介紹課程的目標和預期的學習成果。
介紹人工智能生成創(chuàng)作(AIGC)領域的基本概念、應用和發(fā)展趨勢,相關場景及算法基礎邏輯介紹
2. 電商AI大模型應用梳理與分析(1h)
面向電商場景的大模型應用調(diào)用分享
面向電商場景的客戶服務與主動營銷業(yè)務搭建與技術分享
電商報告生成場景相關業(yè)務需求,場景業(yè)內(nèi)發(fā)展狀態(tài)
3. 大模型應用與提示工程(1h)
分析大模型提示詞設計,多場景提示詞設計,營銷文案生成輔助、代碼生成與調(diào)試、自動回復常見問題等
分析針對電商場景的提示詞使用技巧,指令式列表生成、長對話中保持一致性、表格及代碼生成、引導模型在不同角色之間切換等
課程實戰(zhàn):大模型部署實戰(zhàn)——基于DeepSeek的大模型部署及API調(diào)用(0.5h)
第一天-下午
1. 高質量數(shù)據(jù)構造與清洗(1h)
梳理大模型訓練中的數(shù)據(jù)收集方法與數(shù)據(jù)清洗邏輯
介紹基于Self-instruct的數(shù)據(jù)構造方法、介紹面向結構化知識的數(shù)據(jù)構造方法
高質量數(shù)據(jù)收集與清洗分享——以參與的開源數(shù)據(jù)集Chinese-DeepSeek-R1-Distill-data-110k為例
2. 主流開源語言大模型介紹與比較(1h)
主流大模型介紹,如ChatGLM、Llama、bloom、MOSS、Baichuan、Qwen、Skywork等
領域大模型介紹——法律、醫(yī)療、金融、教育等領域大模型介紹
3. 多模態(tài)生成方法與原理介紹(1h)
圖片生成文本(Image Captioning)的基本概念介紹
基于于大模型(如Transformer)的圖片生成文本技術的核心原理
圖片生成文本的落地應用,如社交媒體與內(nèi)容創(chuàng)作、輔助視覺障礙人士、醫(yī)療健康、教育與科研等
介紹圖生文相關模型概念,如QwenVL系類、Yi-VL等
第二天-上午
1. 大語言模中的高效參數(shù)調(diào)優(yōu)方法與分布式訓練簡述(1h)
常用參數(shù)微調(diào)方法——Prefix Tuning、P-Tuning、LoRA
微調(diào)方法進階——DyLoRA、AdaLoRA、QLoRA、QALoRA、LongLoRA、VERA、S-LoRA
介紹當前常用的模型分布式計算方法,詳細介紹數(shù)據(jù)并行、向量并行、流式并行的多種并行策略等
介紹常見的分布式訓練框架,如Megatron、DeepSpeed等分布式訓練框架介紹
課程實戰(zhàn):大模型微調(diào)實戰(zhàn)——面向電商文案生成的大模型微調(diào)(0.5h)
2. 大模型MCP與Manus系列概述(1h)
介紹Manus相關內(nèi)容概述,與操作方法簡述
OpenManus開源框架概述與本地化部署
OWL開源多智能體協(xié)作框架概述
基于MCP的大模型應用于Agent搭建
課程實戰(zhàn):大模型Agent搭建——面向電商客戶服務MCP服務搭建(0.5h)
第二天-下午
1. 大模型中的強化學習概述(1.5h)
大模型中的獎勵模型,包括介紹獎勵模型基礎、數(shù)據(jù)設計及模型訓練方法
偏好對齊算法介紹——RRHF、RLAIF、DPO、APO等
DeepSeek中的強化學習方法GRPO原理及應用
2. 大模型推理加速與部署(1h)
介紹常用的大模型推理框架與原理,如vLLM、SGLang、FastLLM等
介紹常用大模型整體服務框架,llama.cpp、llama-factory、ollama等
大模型中的量化,如AWQ量化、GPTQ
2. 交流與溝通(0.5h)
課后交流