Job Description
大模型推理后台开发工程师(深圳/北京/上海/杭州) 深圳 分享 在腾讯,后台开发工程师不仅是“又快又稳”的问题解决专家,更是生态共创者。你将与技术团队一同沉淀优质代码,让它成为我们共有的宝贵资产。在不同的业务场景和技术发展阶段,你的架构思维也将帮助更多协作团队拓展新的思考。我们也珍视你的挑战精神,同时欢迎你一起参与团队愿景、文化和产品方向的探讨。 岗位职责 1.负责设计与演进业界领先的大模型在线推理平台,构建支撑亿级日调用量的高性能、高可用、高扩展的服务体系,为公司AI业务提供坚实的推理能力基座;
2.负责设计高性能推理服务架构,结合推理引擎与底层硬件的核心特性,优化动态调度、资源管理等核心后台策略,实现服务性能与成本效益的最优化;
3.负责研发标准化的推理服务框架与配套工具链,打通从模型研发、性能优化到线上部署的全链路流程,提升推理服务工程化落地效率;
4.负责构建平台的高可用架构与可观测性体系,落地故障容灾、限流熔断等核心能力,为容量规划、应急响应提供数据与技术支撑,保障服务的可靠性。 岗位要求 1.具备扎实的后端研发功底,熟练掌握 Golang/C++/Python 至少一门语言,对Linux环境下的分布式系统开发与挑战有深刻理解,具备复杂业务系统的设计与落地经验;
2.具备解决大规模推理服务技术挑战的实践经验,尤其在状态感知的负载均衡、分布式推理的服务编排、长上下文管理或推理服务框架治理等方向有系统设计能力;
3.具备出色的系统性思考和问题解决能力,能够从性能、成本、稳定性的全局视角进行技术选型与架构决策;
4.具备以下一项或多项经验者优先:
1).有AI推理平台核心模块的设计与研发经验;
2).具备vLLM等主流推理框架的服务集成与性能调优经验,并深入理解其架构原理;
3).熟悉推理请求调度机制,并具备复杂场景(文本/多模态/流式)的服务设计经验;
4).有大规模...
分享岗位
方式1:复制岗位链接
方式2:分享岗位海报
手机扫描二维码分享
收藏 TEG 点击了解更多BG信息 技术 三年以上工作经验 更新于年06月15日2.负责设计高性能推理服务架构,结合推理引擎与底层硬件的核心特性,优化动态调度、资源管理等核心后台策略,实现服务性能与成本效益的最优化;
3.负责研发标准化的推理服务框架与配套工具链,打通从模型研发、性能优化到线上部署的全链路流程,提升推理服务工程化落地效率;
4.负责构建平台的高可用架构与可观测性体系,落地故障容灾、限流熔断等核心能力,为容量规划、应急响应提供数据与技术支撑,保障服务的可靠性。
2.具备解决大规模推理服务技术挑战的实践经验,尤其在状态感知的负载均衡、分布式推理的服务编排、长上下文管理或推理服务框架治理等方向有系统设计能力;
3.具备出色的系统性思考和问题解决能力,能够从性能、成本、稳定性的全局视角进行技术选型与架构决策;
4.具备以下一项或多项经验者优先:
1).有AI推理平台核心模块的设计与研发经验;
2).具备vLLM等主流推理框架的服务集成与性能调优经验,并深入理解其架构原理;
3).熟悉推理请求调度机制,并具备复杂场景(文本/多模态/流式)的服务设计经验;
4).有大规模...