職位描述
主要職責1.【模型戰略規劃】: 負責垂直大模型整體技術方向與發展戰略制定,依據行業趨勢與公司業務需求,規劃模型的長期發展路線,確保模型保持競爭力并貼合業務實際。2.【技術體系搭建】:全面負責搭建涵蓋數據處理、模型訓練、部署及優化的完整技術體系3.【模型研發推進】:帶領團隊開展模型研發工作,監督從數據準備、模型訓練到評估優化的全流程。4.【模型部署與維護】與工程團隊緊密合作,負責將訓練好的垂直大模型部署到生產環境中,確保模型能夠穩定、高效地運行。5.【前沿技術探索】關注模型壓縮、安全隱私保護等新技術,優化模型性能,降低成本,增強模型安全性與隱私保護能力,提升公司在國際供應鏈大模型領域的技術競爭力。任職要求:1. 計算機科學、數學、統計學等相關專業,碩士及以上學歷。2. 具有5年以上深度學習、機器學習相關技術研發經驗,其中3 年以上大模型項目開發經驗,有成功的大模型落地案例。3. 精通 Python、TensorFlow 或 PyTorch 等主流深度學習框架,熟悉常用的機器學習算法,如線性回歸、決策樹、神經網絡等,能夠熟練運用其進行模型開發與優化。4. 深入理解 Transformer 架構及其變體,掌握模型訓練過程中的超參數調整、分布式訓練等技術,具備解決復雜模型訓練問題的能力。5. 熟練掌握模型微調、后訓練等相關技術,在實際項目中成功應用并取得顯著成果。6. 了解模型部署相關技術,如容器化技術(Docker、Kubernetes)、云計算平臺(AWS、Azure、阿里云等),能夠將模型高效部署到生產環境中,并進行性能監控與優化
企業介紹
1、團隊:核心成員組成阿里,華為,百度
2、產品:輿情監測方向
3、上海總部,武漢研發中心,北京分公司下半年
4、上海辦公地點:上海市靜安區彭江路大寧易園