
工作职责:
1 负责基于大模型(如 Qwen、LLaMA、LLAVA 等)的应用开发与优化,包括模型微调、性能优化以及在特定任务中的应用。
2 利用 Prompt 工程技术优化模型的输出和交互效果,设计高效的 Prompt 模板以提升模型的任务执行能力。
3 使用 LangChain API 开发和集成大模型应用,构建复杂的多步骤任务和流水线,以实现更智能的应用功能。
4 实施大规模分布式训练,优化计算资源的使用,确保大模型的高效训练和推理。
5 应用模型压缩、蒸馏、剪枝等技术,提高模型的推理速度和资源效率,确保在生产环境中的高效部署。
6 与团队紧密合作,推动大模型的创新应用,并解决与大模型开发相关的技术挑战。
7 持续跟进大模型及其相关技术的发展,主动学习并应用前沿技术,以提升项目的创新性和竞争力。
任职资格:
1 计算机科学、人工智能、数学等相关专业本科及以上学历,具备深厚的机器学习和深度学习理论基础。
2 具备3年以上大模型开发经验,特别是有使用 Qwen、LLaMA、LLAVA 等大模型的实战经验。
3 熟悉 Prompt 工程技术,能够通过设计和优化 Prompts 来提升大模型的任务执行效果。
4 掌握 LangChain API 的使用,能够通过其构建和集成复杂的大模型应用。
5 具备优秀的编程能力,熟练掌握 Python,了解高性能计算技术(如 CUDA、分布式计算框架)。
6 具备良好的团队合作和沟通能力,能够在跨部门和国际化团队中高效协作。
7 英语能力较强,能够阅读和理解英文技术文档和研究论文,并能与国际团队进行有效沟通。