職位描述
該職位還未進(jìn)行加V認(rèn)證,請仔細(xì)了解后再進(jìn)行投遞!
工作職責(zé):
1. 大模型研發(fā)與迭代:負(fù)責(zé)語言大模型(LLM)或多模態(tài)大模型(VLM)的預(yù)訓(xùn)練、微調(diào)(SFT/RLHF/DPO)、對齊(Alignment)及性能優(yōu)化,提升模型在指令遵循、推理、代碼生成等任務(wù)的表現(xiàn)。
2. 探索模型架構(gòu)創(chuàng)新,包括MoE(混合專家)、長上下文(Long Context)、Scaling Law等前沿方向,推動訓(xùn)練效率與效果突破。
673. 前沿技術(shù)研究與應(yīng)用:跟蹤并復(fù)現(xiàn)LLM/VLM領(lǐng)域頂會成果(如CVPR、NeurIPS、ICLR等),主導(dǎo)開源項目貢獻(xiàn),發(fā)表高水平論文或?qū)@?br />4. 研發(fā)多模態(tài)對齊、視頻-語音交互、Agent規(guī)劃等關(guān)鍵技術(shù),構(gòu)建跨模態(tài)理解與生成能力。
675. 數(shù)據(jù)與訓(xùn)練流程優(yōu)化:設(shè)計數(shù)據(jù)配比策略,構(gòu)建高質(zhì)量訓(xùn)練數(shù)據(jù)集,研究數(shù)據(jù)增強(qiáng)、合成及清洗方法,推動Data-Centric閉環(huán)。優(yōu)化從數(shù)據(jù)生產(chǎn)到模型訓(xùn)練的全流程,熟悉Deepspeed、Megatron等分布式訓(xùn)練框架。
676. 模型評測與落地支持:開發(fā)評測工具與平臺,設(shè)計細(xì)粒度評估指標(biāo),分析模型異常表現(xiàn)并提出改進(jìn)方案。
7. 參與技術(shù)成果轉(zhuǎn)化,支持智能客服、內(nèi)容生成、智能體(Agent)等業(yè)務(wù)場景落地。
任職資格:
1. 67教育背景:碩士及以上學(xué)歷,計算機(jī)科學(xué)、人工智能、數(shù)學(xué)等相關(guān)專業(yè),博士優(yōu)先。
2. 67技術(shù)能力:熟練掌握PyTorch/TensorFlow框架,具備CUDA優(yōu)化或大模型訓(xùn)練經(jīng)驗者優(yōu)先。
3. 扎實的算法基礎(chǔ),熟悉Transformer架構(gòu)、強(qiáng)化學(xué)習(xí)(RLHF/RLAIF)及多模態(tài)融合技術(shù)。
674. 科研與實踐經(jīng)驗:以***作者在頂會(ACL、CVPR等)發(fā)表論文,或在國際競賽(Kaggle、KDD Cup等)中取得前5%排名者優(yōu)先。
5. 具備大模型訓(xùn)練、開源項目貢獻(xiàn)、智能體系統(tǒng)開發(fā)等經(jīng)驗者優(yōu)先。
6. 67綜合素質(zhì):目標(biāo)導(dǎo)向,具備獨立科研能力與創(chuàng)新思維,能快速定位技術(shù)瓶頸并提出解決方案。
7. 優(yōu)秀的英文讀寫能力,擅長跨團(tuán)隊協(xié)作,適應(yīng)快節(jié)奏研發(fā)環(huán)境。
1. 大模型研發(fā)與迭代:負(fù)責(zé)語言大模型(LLM)或多模態(tài)大模型(VLM)的預(yù)訓(xùn)練、微調(diào)(SFT/RLHF/DPO)、對齊(Alignment)及性能優(yōu)化,提升模型在指令遵循、推理、代碼生成等任務(wù)的表現(xiàn)。
2. 探索模型架構(gòu)創(chuàng)新,包括MoE(混合專家)、長上下文(Long Context)、Scaling Law等前沿方向,推動訓(xùn)練效率與效果突破。
673. 前沿技術(shù)研究與應(yīng)用:跟蹤并復(fù)現(xiàn)LLM/VLM領(lǐng)域頂會成果(如CVPR、NeurIPS、ICLR等),主導(dǎo)開源項目貢獻(xiàn),發(fā)表高水平論文或?qū)@?br />4. 研發(fā)多模態(tài)對齊、視頻-語音交互、Agent規(guī)劃等關(guān)鍵技術(shù),構(gòu)建跨模態(tài)理解與生成能力。
675. 數(shù)據(jù)與訓(xùn)練流程優(yōu)化:設(shè)計數(shù)據(jù)配比策略,構(gòu)建高質(zhì)量訓(xùn)練數(shù)據(jù)集,研究數(shù)據(jù)增強(qiáng)、合成及清洗方法,推動Data-Centric閉環(huán)。優(yōu)化從數(shù)據(jù)生產(chǎn)到模型訓(xùn)練的全流程,熟悉Deepspeed、Megatron等分布式訓(xùn)練框架。
676. 模型評測與落地支持:開發(fā)評測工具與平臺,設(shè)計細(xì)粒度評估指標(biāo),分析模型異常表現(xiàn)并提出改進(jìn)方案。
7. 參與技術(shù)成果轉(zhuǎn)化,支持智能客服、內(nèi)容生成、智能體(Agent)等業(yè)務(wù)場景落地。
任職資格:
1. 67教育背景:碩士及以上學(xué)歷,計算機(jī)科學(xué)、人工智能、數(shù)學(xué)等相關(guān)專業(yè),博士優(yōu)先。
2. 67技術(shù)能力:熟練掌握PyTorch/TensorFlow框架,具備CUDA優(yōu)化或大模型訓(xùn)練經(jīng)驗者優(yōu)先。
3. 扎實的算法基礎(chǔ),熟悉Transformer架構(gòu)、強(qiáng)化學(xué)習(xí)(RLHF/RLAIF)及多模態(tài)融合技術(shù)。
674. 科研與實踐經(jīng)驗:以***作者在頂會(ACL、CVPR等)發(fā)表論文,或在國際競賽(Kaggle、KDD Cup等)中取得前5%排名者優(yōu)先。
5. 具備大模型訓(xùn)練、開源項目貢獻(xiàn)、智能體系統(tǒng)開發(fā)等經(jīng)驗者優(yōu)先。
6. 67綜合素質(zhì):目標(biāo)導(dǎo)向,具備獨立科研能力與創(chuàng)新思維,能快速定位技術(shù)瓶頸并提出解決方案。
7. 優(yōu)秀的英文讀寫能力,擅長跨團(tuán)隊協(xié)作,適應(yīng)快節(jié)奏研發(fā)環(huán)境。
工作地點
地址:深圳寶安區(qū)庭威產(chǎn)業(yè)園-2號樓1B2樓D區(qū)


職位發(fā)布者
HR
深圳市億道控股有限公司

-
電子技術(shù)·半導(dǎo)體·集成電路
-
500-999人
-
公司性質(zhì)未知
-
深圳市寶安區(qū)28區(qū)大寶路49-1號金富來大廈
相似職位
-
機(jī)械維修工 面議昆都侖區(qū) 應(yīng)屆畢業(yè)生 不限重慶慧獵信息科技有限公司
-
報批報建專員 6000-8000元昆都侖區(qū) 應(yīng)屆畢業(yè)生 大專人民電器集團(tuán)有限公司
-
辦公室文員 4000-5000元昆都侖區(qū) 應(yīng)屆畢業(yè)生 大專人民電器集團(tuán)有限公司
-
報批報建專員 6000-8000元昆都侖區(qū) 應(yīng)屆畢業(yè)生 大專人民電器集團(tuán)有限公司
-
辦公室文員 4000-5000元昆都侖區(qū) 應(yīng)屆畢業(yè)生 大專人民電器集團(tuán)有限公司
-
工程機(jī)房運(yùn)行工 面議九原區(qū) 應(yīng)屆畢業(yè)生 不限包頭市伊盟人家餐飲有限公司