HR电话:
HR邮箱:
NPU/GPU计算核工程师/架构师
1) 根据应用痛点、技术热点制定NPU/GPU计算核技术路线、规格和特性、实现策略。
2) NPU/GPU计算核架构、实现。
3) NPU/GPU计算核设计在特定SoC中配置、调优。
4) NPU/GPU计算核与片内/外存储和互联,算法和软件的对接和协同优化。
1) 微电子、电子与通信、计算机等相关专业,硕士以上学历,2年以上相关领域直接工作经验/志趣。
2) 基本技能:Verilog设计与验证,逻辑综合与PPA优化,设计与验证文档,英文读写。
3) 重要素质:team player, think out box。
1) 熟悉基本的运算单元(基本运算、超越函数、Tensor)
2) 熟悉存储系统Cache/MMU/SGDMA设计,熟悉互联协议对接,特别是内存语义及其优化。
3) 熟悉指令并行、数据并行和任务并行的技术路线,SIMD/Vector/VLIW/SIMT设计,关键文献/作者。
4) 熟悉NPU/GPU基本原理,包括计算、访存、互联、指令和任务调度等;
5) 熟悉/使用业界至少一种GPU架构,Nvidia、AMD、IMG、ARM。参与过至少一款NPU/GPU核心设计。
6) 熟悉特定SoC中配置和调试计算核,包括OpenCL/CUDA对接,roofline分析和优化等。
GPU/NPU软件工程师/架构师
1) 根据应用痛点、技术热点制定软件技术路线、规格和特性、实现策略。
2) 软件编程、部署、编译、驱动相关的架构设计与实现。
3) 软件在特定SoC和应用中部署、调优。
4) 软件与芯片、算法的对接和协同优化。
1) 计算机、数学等相关专业,硕士以上学历,2年以上相关领域直接工作经验/志趣。
2) 基本技能:Pytorch/C/CUDA/OpenCL编程与测试,程序计算图分析与PPA优化,设计与验证文档,英文读写。
3) 重要素质:team player, think out box。
1) 熟悉常见AI算法计算特征分析、并行部署,常见AI算子计算特征分析、编程、算子融合和优化。领域技术路线、关键文献/作者。
2) 熟悉PyTorch、vLLM、SGlang等编程框架应用及内部架构,MLIR等计算图中间表示,实现算子自定义和计算图优化。
3) 熟悉CUDA/Gcc/LLVM应用及架构,循环展开和异步编程等,能够定义优化pass,对接新架构指令和调度。
4) 熟悉CUDA/OpenCL host-device接口、runtime和驱动。
5) 熟悉常见的加速库,如BLAS、cuDNN、xCCL等;PCIe驱动、SHMEM等编程。
6) 熟悉主流NPU/GPU架构,NSight/VTune等调试工具,指令调度、存储、roofline等优化技术,在业界至少一款架构上端到端开发和交付过程序。
芯片互联工程师/架构师
1) 根据应用痛点、技术热点制定NoC技术路线、规格和特性、实现策略。
2) NoC架构、实现。
3) NoC设计在特定SoC中配置、调优。
4) NoC与片内计算和存储,die2die、片外互联和存储的对接和协同优化。
5) 与SoC和软件协同,看护架构,保证端到端成功。
1) 微电子、电子与通信、计算机等相关专业,硕士以上学历, 2年以上相关领域直接工作经验/志趣。
2) 基本技能:Verilog设计与验证,逻辑综合与PPA优化,设计与验证文档,英文读写。
3) 重要素质:team player, think out box。
1) 熟悉AMBA AXI/ACE/CHI协议;片间UALink、Ethernet/RDMA、UEC等协议。
2) 熟悉NoC基本原理,拓扑、路由、流控、差控等;NoC领域技术路线、关键文献/作者。
3) 熟悉NoC router/bridge的架构和微架构设计,Cache一致性协议与架构设计;使用过业界NoC产品。
4) 熟悉特定SoC中配置和调试NoC,包括地址空间、时钟域、频率提升、QoS等。
AI算法工程师/架构师
1) 算法原理、应用和趋势洞察,为应用和芯片设计提供策略输入。
2) 算法构建、调优、应用部署,面向文档和编码等生产力工具、一般AI应用。
3) 算法与软件、芯片的对接和协同优化。
1) 人工智能、计算机、数学等相关专业,硕士以上学历,2年以上相关领域直接工作经验/志趣。
2) 基本技能:PyTorch等框架,算法构建、分析和调优,设计与验证文档,英文读写。
3) 重要素质:team player, think out box。
1) 熟悉常见的AI算法、组合优化算法。领域技术路线、关键文献/作者。
2) 熟悉算法开发工具,PyTorch、vLLM等,业界常用算法模块及其加速库。
3) 熟悉算法开发流程,数据集、训练、微调、量化、蒸馏、强化学习。
4) 熟悉RAG、多模态CLIP、编程工具、MCP等构建完整的workflow。
5) 熟悉特定软硬件平台部署和调优算法运行性能,根据特定应用对算法对齐和调优。
6) 熟悉主流算法应用,并在完成至少一个应用算法的端到端实现和上线服务。
商业保险
年度体检
人才落户
住房借款
生日会
下午茶
弹性工作