AI模型Devin展现软件工程师能力 独立完成工程项目

2024-03-13 23:01:05 网络 蒜泥倒霉

AI初创企业Cognition Labs近日推出了一款名为Devin的生成式人工智能模型,该模型具备软件工程师职能。据公司声明,Devin已成功通过多家顶尖AI企业的实际工程面试,并在Upwork上完成了真实工程项目。这款AI工具自带专属外壳、代码编辑器及浏览器,能够完成复杂工程任务,包括但不限于从头到尾编写代码项目、搭建和部署网站与应用程序,甚至能训练和完善自身的AI模型。

Cognition Labs在社交媒体平台X(原Twitter)上发布了这一消息,并称Devin为“首位软件工程师”。该公司透露,Devin在SWE-Bench编码基准测试中表现出色,得分高达13.86%,远超同类主流AI模型Claude 2(4.80%)和GPT-4(1.74%),并且能在无协助情况下独立解决问题。Devin不仅能快速学习陌生技术、自始至终构建并上线应用,还能自动识别并修复代码库中的错误、参与开源仓库的维护更新、对成熟生产环境进行贡献,以及自我训练优化。

尽管Cognition Labs对其成果夸下海口,但目前由于Devin尚未公开发布,这些宣称尚无法验证。不过,若其性能如宣传所示,Devin无疑将开创AI驱动代码生成领域的全新标准。不同于只能基于提示执行有限任务的辅助型编码模型,Devin具备自主工作并承担完整项目的能力。当下热议的核心问题是:Devin是否能替代人类软件工程师?目前,Devin正处于早期试用阶段,有意聘请这款AI模型进行工程工作的客户可与开发团队取得联系。

相关内容

更多

精品推荐

更多