赞
踩
上海人工智能实验室(上海AI实验室)AI训练与计算中心致力于定义并引领新一代AI训练与计算系统构建,建设具有广泛包容性的AI计算与编译体系,发展高扩展、广开放、优能效、强适应的系统,承担支撑人工智能技术的基石工作。
面向通用智能和交叉学科的未来发展,中心将打造新一代开放式人工智能训练系统,定义全新的训练系统编程范式,突破多维度并行技术、自适应训练技术以及多元设备环境中的高效分布式协作技术,实现超大模型的高效训练,探索模型训练的能效极限,满足通用智能与超大规模科学计算融合的需求。
目前,中心已推出DeepLink人工智能开放计算体系、书生·天际(LandMark)千亿参数NeRF模型训练与100平方公里1K分辨率模型的实时渲染、书生·浦语(InternLM)计算与通信高效重叠等研究成果,并获得ASPLOS 2023杰出论文奖。
中心还将持续探索开放式的人工智能计算体系,研究并突破面向多计算后端的计算编译技术,推动计算能力与算法发展的同步演进,实现云边端多种计算单元的高效适配与训练支持,满足新一代智算基础设施带来的全新计算需求。
现针对以下岗位招募人才:
AI训练与计算中心青年科学家
高性能异构计算青年科学家
大模型训练技术青年研究员
大模型训练系统研发工程师
深度学习训练框架算法工程师
深度学习编译研究工程师
C++开发工程师
多模态大模型青年研究员
多模态大模型工程师
自然语言处理大模型青年研究员
自然语言处理大模型工程师
(相关岗位具体内容可上下滑动查看)
AI训练与计算中心青年科学家
职位描述:
1、带领团队推进分布式训练中的计算和通信优化,充分利用算力,使用大量加速卡探索性能边界;
2、优化加速芯片显存和通讯的使用模式,支持高效训练各种大模型;
3、与高校合作在系统领域研究大规模系统研究工作;
4、提升分布式训练方向在学术、产业的影响力。
职位要求:
1、计算机基础扎实,熟悉 C/C++,具备系统软件开发架构能力;
2、熟悉计算机体系结构以及并行计算基本技术,5年以上大规模分布式训练相关工作经验;
3、具有NVIDIA、AMD、Intel 等至少一种 GPU 体系结构上的性能调优经验;
4、熟悉MPI、NCCL至少一种分布式通信库,有百节点计算任务性能调优经验;
5、熟悉模型训练原理和Optimizer基本原理,了解分布式训练基本方法,对混合精度训练、数据并行等训练加速方法有所了解者优先。
高性能异构计算青年科学家
职位描述:
1、带领团队建设以编译为核心的AI训练计算软件生态,联合AI加速芯片厂商形成软硬件接口标准;
2、设计开放AI编译软件栈架构,对接多种AI加速芯片;
3、关注AI计算&编译前沿技术发展趋势,布局实验室编译技术研究方向;
4、持续提升实验室编译计算方向在学术和产业的影响力。
职位要求:
1. 5年以上工作经验,优秀博士可适当放宽工作年限要求;
2. 计算机基础扎实,熟悉 C/C++,具备系统软件开发架构能力;
3. 熟悉计算机体系结构以及并行计算基本技术;
4. 具有 NVIDIA、AMD、Intel 等至少一种GPU体系结构上的性能调优经验;
5. 熟悉CUDA、OpenCL、Vulkan、Metal、OpenGL Compute Shader 等至少一种开发原语;
6. 有代数矩阵运算、信号处理、计算机视觉、图像处理或 3D 图形学算法在不同处理器上移植和调优经验的优先;
7. 开发运营过开源软件或者为知名开源软件贡献过代码者优先。
大模型训练技术青年研究员
职位描述:
1、跟踪生成式AI研究最新进展;
2、复现生成式AI经典工作;
3、发掘生成式AI训练及推理中的新优化机会。
职位要求:
1、计算机或人工智能相关专业博士学位;
2、具有框架、系统结构方面经验;
3、具备资深工程经验;
4、有AI系统软件方面研究成果者优先。
大模型训练系统研发工程师
职位描述:
1、参与设计并实现高可用、可扩展、分布式机器学习系统,支撑大模型的高效训练与推理,实现技术突破;
2、优化大模型训练场景的分布式系统;
3、持续提升平台的利用效率和易用性,探索业界前沿的大模型相关技术,设计并实现于训练系统中。
职位要求:
1、计算机相关专业硕士及以上学位;
2、扎实的编程基础,熟悉多线程编程、网络通信、内存管理和设计模式,对大型C++/Python系统工程有开发经验,有优化分布式系统性能问题的能力和经验;
3、对AI系统有技术热情,对前沿技术攻坚有浓厚的兴趣和追求,热衷于追求技术极致与创新;
具备以下一个或者多个条件者优先:
a. 对CUDA、NCCL、RDMA通信有编程和性能调优经验;
b. 熟悉Pytorch或者Ray等主流深度学习框架源码。
深度学习训练框架算法工程师
职位描述:
1、负责实验室AI工作负载/算法模型在寒武纪AI芯片(MLU)上的量化分析、移植、实现、端到端性能优化和精度调优;
2、在MLU软硬件平台下,开发训练、推理、机器视觉算法库;分析算子中可能存在的性能瓶颈,并开展优化,提升产品在业界的竞争力;包括但不限于针对算子的需求分析、设计、开发及单元测试、优化、集成和版本维护。
职位要求:
1、计算机、电子工程、数学、通信、自动化等相关专业;
2、熟练操作Linux系统,熟练掌握C/C++/Python/Shell,有良好的编程习惯,熟悉软件开发流程;
3、对计算机视觉、语音识别、搜索广告推荐、自然语言处理、AI HPC中的某一个场景具有浓厚的兴趣和一定的积累与见解;
4、熟悉并使用过至少一种主流深度学习框架(TensorFlow/PyTorch/TVM等),具有良好的团队协作精神,责任心强,能够积极主动地完成相关工作。
5、拥有以下经验者优先:
a、对至少一种主流深度学习框架(TensorFlow/PyTorch等)有开发者视角的理解,对框架设计或者调优有一定的见解和经验优先;
b、对MPI/CCL等底层高性能分布式方案,以及数据、模型、管道并行等高层分布式方案有一定的见解和经验;
c、熟悉计算机体系结构,有(GPU、TPU、X86、ARM、DSP)上的并行计算、异构计算、性能优化经验;
d、有业界常用的高性能库(如TensorRT、OpenBLAS、MKL、cuDNN等)开发和性能调优经验。
深度学习编译研究工程师
职位描述:
1、参与国产芯片接入深度学习框架的开发工作;
2、承担抽象编译器接入框架的任务,提高接入效率;
3、运用多种技术手段,加速模型训练;
4、参与其他相关前沿技术的调研与运用。
职位要求:
1、具有良好的编程习惯,熟练使用Python/C++语言,有较强的Debug能力;
2、对深度学习框架或者深度学习编译器有较深理解以及实践经验(包含不限于Pytorch、TF、JAX、XLA、MLIR、TVM等);
3、具备较强的自驱动力,对先进技术有浓厚兴趣;
4、有较强的团队精神和沟通交流能力;
5、熟悉Pytorch2.0新特性,拥有大模型训练优化经验或AI for Science经验者优先。
C++开发工程师
职位描述:
1、参与具体的框架研发,实现深度学习领域新方法的落地,了解相关领域的新技术;
2、参与深度学习框架Parrots的研发与优化,实现大数据工业级应用条件下的深度学习核心架构优化;
3、适配深度学习最新算法与架构,对框架进行调整、改进和优化;
4、优化框架的训练速度,包括计算和通信及其调度,以提高模型训练的效率;
5、扩充深度学习框架的功能并提升计算能力,完善工具体系。
职位要求:
1、以下要求任意满足一条:
a、2年以上Linux下的C++或Python开发经验,熟练使用模板编程,有开源代码贡献经验更佳;
b、熟悉计算机体系结构、并行计算基本技术,以及GPU并行计算基本原理,有2年以上的GPU编程经验;
2、扎实的计算机科学功底和编程能力,熟练使用常见的算法和数据结构,拥有良好的编程习惯和代码风格;
3、有良好的文档习惯,及时按照要求撰写技术文档和工作进展;
4、熟悉Pytorch、Tensorflow等主流深度学习框架源码者优先。
多模态大模型青年研究员
职位描述:
1、直接参与多模态大模型的研发工作,包括多模态大模型的设计、训练、调优等;
2、开展多模态前沿算法研究工作,包括但不限于多模态2D/3D感知、图文生成等;
3、开展大模型训练基础理论研究工作,包括但不限于模型设计、训练策略、优化算法、模型压缩等。
职位要求:
1、计算机或人工智能相关专业博士学位,有多篇顶会顶刊论文发表;
2、对自然语言处理或计算机视觉至少一个方向有深入了解;
3、熟练掌握Python和PyTorch,有较强的工程能力。
4、拥有多模态算法研究和大模型预训练经验者优先;
5、拥有知名学术工作、开源项目、国际竞赛成果者优先;
6、熟悉Deepspeed、Colossalai或Megatron等大模型训练框架者优先。
多模态大模型工程师
职位描述:
1、参与多模态大模型的训练与调优,稳定大模型训练、提高训练效率等;
2、支撑大模型的各种落地应用,将大模型应用于真实场景;
3、参与大模型评测的开发工作。
职位要求:
1、计算机或人工智能相关专业本科及以上学历,有顶会论文可加分;
2、熟悉自然语言处理或计算机视觉至少一个研究方向;
3、熟练掌握Python和PyTorch,有较强的工程能力;
4、熟悉CUDA开发和性能调优可加分;
5、熟悉Deepspeed、Colossalai或Megatron等大模型训练框架,拥有大模型预训练经验优先;
6、拥有知名开源项目、国际竞赛成果者优先。
自然语言处理大模型青年研究员
职位描述:
1、参与大模型研究工作,包括超大规模模型的训练与调优;
2、开展大模型机理以及优化研究,包括大模型能力探究、大模型能力外沿扩展等;
3、负责大模型相关周边研究,如大模型伦理安全研究、大模型推理加速、大模型Prompt优化等。
职位要求:
1、计算机或人工智能相关专业博士学位,有多篇顶会顶刊论文发表;
2、对自然语言处理或计算机视觉至少一个研究方向有深入了解;
3、熟练掌握Python和PyTorch,有较强的工程能力。
4、熟悉Deepspeed、Colossalai或Megatron等大模型训练框架者优先;
5、有知名学术工作、开源项目、国际竞赛成果者优先。
自然语言处理大模型工程师
职位描述:
1、参与大模型的训练与调优中,稳定大模型训练、提高训练效率等;
2、负责Intern-LM算法库的相关工作,实现并维护算法库;
3、支撑大模型的各种落地应用,缩短大模型与真实应用场景的距离。
职位要求:
1、计算机或人工智能相关专业本科及以上学历,有顶会论文可加分;
2、熟悉自然语言处理常见模型;
3、熟练掌握Python和PyTorch,有较强的工程能力。
4、熟悉CUDA开发和性能调优可加分;
5、熟悉Deepspeed、Colossalai或Megatron等大模型训练框架者优先;
6、拥有知名学术工作、开源项目、国际竞赛成果者优先。
本次招聘同时开放社招、校招、实习岗位,欢迎有志该领域的人士踊跃投递。
投递方式
方式一:
发送简历至邮箱:zhanghuanhuan@pjlab.org.cn,邮件及简历命名格式:姓名 - 申请的岗位名称 -(校招/社招/实习)。
方式二:
登录上海人工智能实验室官方网站(www.shlab.org.cn),点击导航栏“加入我们”,搜索对应岗位名称投递。
方式三:
扫描下方二维码进行或点击文末“阅读原文”投递。
上海人工智能实验室(上海AI实验室)
我国人工智能领域的新型科研机构,开展战略性、原创性、前瞻性的科学研究与技术攻关,突破人工智能的重要基础理论和关键核心技术,打造“突破型、引领型、平台型”一体化的大型综合性研究基地,支撑我国人工智能产业实现跨越式发展,目标建成国际一流的人工智能实验室,成为享誉全球的人工智能原创理论和技术的策源地。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。