Gartner:生成式AI不会取代软件工程师

愤怒的蜗牛

全球著名咨询调查机构Gartner,在官网发布了一个《生成式AI正在重新定义软件工程领导者的角色》的专访。

主要分享了Gartner高级总监、分析师HarithaKhandabattu对生成式AI在软件编程领域的应用情况,整个流程以问答方式进行。

Gartner:生成式AI不会取代软件工程师

生成式AI会取代软件工程师吗?

Haritha:不会。尽管生成式AI工具非常先进,但其目的并非取代工程师,而是提高生产力。它可以自动化重复性任务,但无法复制工程师所具备的创造力、批判性思维和问题解决能力。

2024年第四季度Gartner曾对美国和英国400名软件工程领导者的调查显示,多达一半的软件开发团队使用各种生成式AI工具来增强工作流程,它们起到的是效率倍增的作用,而非替代人力。

Gartner:生成式AI不会取代软件工程师

对于经验丰富的工程师,生成式AI可以提供指导和框架,帮助他们在不同平台和项目中更高效地适应;经验不足的团队成员则可以通过它节省处理日常任务的时间,从而将精力集中在更复杂的挑战上。

当软件工程领导者试点和推广生成式AI工具时,核心目标应是展示其商业价值,证明它如何改变团队以推动实际业务成果,将技术成果与业务目标挂钩,为团队的持续投资提供有力依据。

Gartner:生成式AI不会取代软件工程师

生成式AI将如何改变软件工程领导者招募人才的方式?

Haritha:在招聘人才方面,生成式AI也将带来显著变化。招聘和人才管理通常涉及总结面试反馈、撰写职位描述和新员工入职等耗时任务,而生成式AI可以简化这些流程。

Gartner在2024年第四季度曾对487名首席信息官和IT领导者的调查发现,超过33%的受访者已经在使用AI生成职位描述。

它还能通过快速识别最佳候选人加快招聘速度,例如,通过输入“平台工程经理的关键技能有哪些”这样的提示词进行岗位分析,为领导者提供参考,但仍需人工审核数据;

AI驱动的面试智能平台可以转录和总结面试内容,节省时间。此外,在新员工入职环节,AI聊天机器人可以解答常见问题,引导他们完成文书工作和培训,使其更快适应工作并投入关键项目。

软件工程领导者可以采取哪些关键措施来帮助他们团队获得成功?

Haritha:为帮助团队取得成功,软件工程领导者可以采取三大关键行动。

首先,技能管理和发展是核心职责,领导者必须与人力资源部门合作,创建定制化的AI培训项目,为不同水平的工程师提供个性化学习体验。Gartner预测,到2027年,70%的软件工程领导者职位描述中将明确要求具备对生成式AI的监督能力,远高于目前的不到40%,因此领导者必须提升团队在大语言模型、提示工程等方面的技能,以应对新挑战。

Gartner:生成式AI不会取代软件工程师

其次,要构建持续学习的文化,灵活的学习计划有助于取得更好的业务成果,培养适应性强的员工,并满足不断变化的技能需求,关键在于提前培养员工的生成式AI技能。

最后,需制定新的伦理政策,明确在DevOps、DataOps和ModelOps等流程中的责任分配,由于模型再训练和版本回滚等任务现在需要软件工程和数据团队共同完成,因此必须协调这些跨职能活动,确保责任落实和顺利交接,同时还应让法律和安全团队参与其中。

今天凌晨1点30,OpenAI宣布开放GPT-4.1,从今天开始可以在ChatGPT中使用。

GPT-4.1是一款专门针对编码任务和指令执行的模型,推理效率非常高,对于日常编码需求来说,是替代o3和o4-mini非常好的选择。

Gartner:生成式AI不会取代软件工程师

GPT-4.1是OpenAI发布的最新模型,其最大亮点之一就是支持100万tokens上下文,这也是OpenAI首次发布长窗口模型。

与前代模型相比,GPT-4.1、GPT-4.1Mini和GPT-4.1Nano能够处理多达100万tokens的上下文,是GPT-4o的8倍。

OpenAI在LongContextEvals上对长文本进行了测试,测试结果显示,GPT-4.1系列的三个模型均能够在语料库的任何深度找到目标文本,无论是开头、中间还是结尾,甚至在长达100万tokens的上下文中,模型依然能够准确地定位目标文本。

Gartner:生成式AI不会取代软件工程师

OpenAI还在Multi-RoundCoreference进行了测试,通过创建合成对话来测试模型在长上下文中的理解和推理能力。

在这些对话中,用户和助手交替进行对话,用户可能会要求模型生成一首关于某个主题的诗,接着要求生成另一首关于不同主题的诗,然后可能要求生成一个关于第三个主题的短故事。模型需要在这些复杂的对话中找到特定的内容,例如“第二篇关于某个主题的短故事”。

测试结果显示,GPT-4.1在处理长达128Ktokens的数据时显著优于GPT-4o,并且在长达100万tokens的上下文中依然能够保持较高的性能。

Gartner:生成式AI不会取代软件工程师

在编码能力测试中,SWEBench评估将模型置于Python代码库环境,让其探索代码库、编写代码和测试用例。结果显示,GPT-4.1的准确率达到55%,而GPT-4o仅为33%。

Gartner:生成式AI不会取代软件工程师

在多语言编码能力测试方面,Aderpolyglot基准测试涵盖多种编程语言和不同格式要求。GPT-4.1在差异性能上较GPT-4o提升一倍,在处理多语言编程任务、代码优化和版本管理时更高效。

在指令遵循能力测试中,OpenAI构建内部评估体系,模拟API开发者使用场景,测试模型对复杂指令的遵循能力。每个样本包含分属不同类别的复杂指令,并分难度等级。在困难子集评估中,GPT-4.1远超GPT-4o。

Gartner:生成式AI不会取代软件工程师

在多模态处理测试的视频MME基准测试中,GPT4.1对30-60分钟无字幕视频进行理解并回答多项选择题,取得72%的成绩,达到当前最佳水平,在视频内容理解上实现重大突破。

价格方面,GPT-4.1系列在性能提升的同时,价格更具竞争力。GPT-4.1相比GPT-4o价格降低26%,而GPT-4.1Nano作为最小、最快且最便宜的模型,每百万token的成本仅为12美分。

Gartner:生成式AI不会取代软件工程师

目前,Plus、Pro和Team用户可以通过模型选择器中的“更多模型”使用GPT-4.1。企业和教育用户将在接下来的几周内获得访问权限。

OpenAI还在ChatGPT中为所有用户推出GPT-4.1-mini,取代GPT-4o-mini。

Gartner:生成式AI不会取代软件工程师


您需要 登录账户 后才能发表评论

发表评论

快捷回复: 表情:
AddoilApplauseBadlaughBombCoffeeFabulousFacepalmFecesFrownHeyhaInsidiousKeepFightingNoProbPigHeadShockedSinistersmileSlapSocialSweatTolaughWatermelonWittyWowYeahYellowdog
评论列表 (暂无评论,19人围观)

还没有评论,来说两句吧...

目录[+]

取消
微信二维码
微信二维码
支付宝二维码