課程解讀
課程亮點
系統掌握Python深度學習與大模型核心技術,從理論到實戰構建AI應用全鏈路能力。本課程系統講解Python深度學習核心技術,從神經網絡基礎、卷積神經網絡、目標檢測、循環神經網絡到Transformer大模型,結合大量代碼實踐與真實項目案例,幫助學員掌握從模型構建、訓練優化到大模型私有化部署、微調與RAG知識庫建設的全鏈路實戰能力,覆蓋計算機視覺、自然語言處理、多模態應用等多個前沿方向。
適用對象
本課程主要面向人工智能算法工程師、深度學習研發人員、數據科學家及高校相關專業師生,特別適合希望系統提升深度學習理論與實戰能力,掌握大模型部署、微調與RAG技術的中高級開發人員。
相關事宜
2026年共舉辦2期課程
北京2026年5月29日~31日
上海2026年9月17日~19日
研修費用:4600元/人 (含培訓、工作餐、資料、證書)
工程師高培報名熱線:13269857695
微信致電均可,歡迎來詢!
課程大綱
第1節 Python深度學習基礎:深度學習在圖像處理、文本分類中的應用場景;深度學習和神經網絡基礎;函數、損失函數與優化算法;反向傳播算法;深度神經網絡模型(BP神經網絡、卷積神經網絡CNN、循環神經網絡RNN);動手實踐:構建簡單的神經網絡——使用Python和TensorFlow/PyTorch構建和訓練神經網絡模型,數據預處理與模型評估。
第2節 卷積神經網絡原理及其應用:AlexNet、VGGNet、GoogleLeNet;Inception-V3/V4;ResNet、DenseNet;使用遷移學習實現蒙古文識別;獲取中間隱層的特征及可視化;隱層特征的意義和使用;遷移學習的trick(學習率、衰減、模型預訓練方式);代碼和案例實踐:數字圖片分類,卷積核與特征提取,以圖搜圖,海量蒙古文識別,隱特征可視化及其應用。
第3節 目標檢測:視頻關鍵幀處理;卷積的位置不變性與圖像定位的關系;物體檢測與定位(RCNN、Fast-RCNN、Faster-RCNN、MaskRCNN);YOLO、SSD;UNet及其與殘差網絡的結合;FaceNet與特征;EfficientNet、EfficientDet;視頻幀的目標定位;時空卷積網絡;SlowFast;代碼和案例實踐:人臉檢測,OCR字體定位和識別,睿客識云,氣象識別,視頻分類的trick,政務大廳視頻監控的真實系統。
第4節 循環神經網絡及其應用:數據預處理與序列填充;數據集劃分(訓練集、驗證集、測試集);使用PyTorch和TensorFlow構建RNN模型(自定義RNN層、堆疊RNN層);損失函數與評估指標的選擇;GRU(門控循環單元);雙向RNN(Bi-RNN);序列到序列(Seq2Seq)模型;注意力機制(Attention Mechanism);機器翻譯、語音識別等應用場景。
第5節 自注意力Self-Attention和Transformer模型:編碼器、解碼器;自注意力機制詳解;Transformer(Mask Multi-Head Attention、位置編碼);特定于任務的輸入轉換;無監督預訓練與有監督Fine-tuning;BERT思路理解;GPT基本思想;基于Transformer模型的分類任務;數據不平衡與領域適應性;模型選擇與調優;代碼和案例實踐:基本問答系統的代碼實現,深入閱讀理解的代碼實現,段落相關性代碼實現,高考作文神器,作文生成。
第6節 本地大模型私有化部署實操:1、Deepseek-R1蒸餾版的部署實操(模型獲取:通過HuggingFace官方倉庫申請權限,下載deepseek-r1-7B/8B/32B/70B的safetensors格式權重;推理服務啟動:關鍵參數trust_remote_code、max_model_len等講解,多種啟動服務方式對比;服務驗證:代碼調用與服務API參數設置);2、Deepseek-R1 671B滿血版的部署流程(模型獲取:HuggingFace/Modelscope/github的參數下載;硬件配置說明:16張A100(700G顯存)、2T硬盤空間;對標模型的比較:QwQ系列與阿里32B模型對比);3、Llama-3-8B快速部署(量化加速:FP8特點及Deepseek量化章節解讀;REST API調用:深度學習系統部署的常用方式及AI算法部署框架)。
第7節 使用蒸餾大模型完成微調、數據準備過程、模型訓練代碼實踐:1、Deepseek-R1領域數據微調(數據準備:JSONL格式,含instruction/input/output,數據源包括財報、券商研報、金融問答對等,關鍵處理使用SentencePiece重組專業術語tokenization;QLoRA訓練配置:微調常用方法,多種LoRA方式對比;啟動訓練:顯存優化與GPU并行);2、探討適合微調的業務場景(闡述項目中RAG模式和LoRA模式的選擇,分析微調方案的優勢與不適合微調的場景);3、UI缺陷檢測-多模態微調實踐(多模態數據融合原理,基于預訓練模型進行多模態微調操作,從數據標注到模型部署的完整流程,缺陷檢測效果評估,大型軟件項目中的UI缺陷檢測)。
第8節 知識庫建設與自定義知識問答RAG:1、私有數據的文檔生成系統全流程實操——架構設計(數據層:Wind API實時獲取宏觀指標+PDF解析模塊;推理層:Deepseek-R1作為生成核心,Mistral-8x7B進行事實核查;評估層:Rouge-L評估內容一致性,FinBERT檢測財務數據矛盾);以部署拓撲理清整體脈絡(常規分析、復雜計算、數據采集、向量數據庫、路由決策、Deepseek-R1/Mistral-8x7B、合規審查、PDF輸出);2、基于知識庫的問答系統實操——關鍵技術點(RAG增強:使用LlamaIndex構建行業知識圖譜,FAISS向量庫實現百萬級文檔秒級檢索;記憶管理:緩存最近輪次的對話摘要,采用CoT提示工程技術;風控攔截:關鍵詞過濾如“保證收益”“”等違規表述,置信度閾值設定softmax概率<0.7時觸發人工接管)。
主講專家
業內
深度學習與人工智能領域具備深厚的學術積淀與行業影響力。
經驗豐富
完成50多個深度學習實踐項目,廣泛應用于多個領域,具備豐富的跨行業項目落地經驗與技術培訓能力。
