-
reasoning
OpenAI 重磅发布 GPT-5:从聊天机器人迈向智能体,AI 正式进入企业实用时代
【HRTech 报道】2025年8月7日,OpenAI 正式发布了其最新旗舰级大模型 GPT-5,标志着生成式人工智能进入“智能体”新阶段。OpenAI CEO 萨姆·奥特曼在发布会上表示,GPT-5 是通往通用人工智能(AGI)的关键一步。不同于以往注重模型规模和参数数量,GPT-5 更侧重于架构创新与企业级能力落地,预示着 AI 正式成为企业核心工具的一部分。
从模型到智能体:统一架构打开多场景应用空间
GPT-5 是 OpenAI 首个“统一模型”,整合 GPT 系列与 o‑series(推理模型),不仅具备对话能力,更可以像智能代理一样执行复杂任务,包括代码生成、项目规划、调试协助和研究报告撰写等。这一转变也意味着,企业将不再仅依赖外部插件或工具,而是可以通过 GPT-5 实现高度自动化的工作流,开启“AI 工作伙伴”时代。
企业级应用升级:写作、医疗、金融能力全面增强
在多个关键行业场景中,GPT-5 展现出显著性能提升:
医疗健康场景的幻觉率降至仅 1.6%,较 GPT-4o 的 20.6% 大幅降低;
通用对话场景幻觉率也降至 4.8%;
可即时生成完整软件(vibe coding),实现从自然语言到代码部署的全过程自动化;
被媒体评价为“具备博士级专家问答能力”的 AI 助手。
这些提升让 GPT-5 在高风险行业如医疗、法律、金融中变得更加可靠,适用于决策支持、合规判断及精密内容生成。
技术亮点:即时软件与动态推理机制
GPT-5 引入了“实时路由器(real-time router)”与“test-time compute”机制,可根据用户输入的复杂程度动态调整推理深度与计算资源,在保证速度的同时提升响应准确率。这使得 GPT-5 成为真正适应多任务、多需求的智能系统。
基准测试领先但保持克制
在 SWE-Bench Verified(真实 GitHub 编程任务)中,GPT-5 首次尝试得分达 74.9%,略高于 Claude Opus 4.1 的 74.5%;在 GPQA Diamond(博士级科学问题测试)中取得 89.4%,领先行业同类模型。但在 Humanity’s Last Exam(跨学科能力测试)上使用工具后的得分为 42%,略低于 xAI 的 Grok 4 Heavy(44.4%)。OpenAI 也坦言,部分代理任务与安全机制仍在持续优化中。
用户体验升级:人格化、记忆能力双提升
个性化设定:ChatGPT 中新增了四种人物性格设置——“Cynic(愤世者)”、“Robot(机器人)”、“Listener(倾听者)” 和 “Nerd(学究)”,让用户能够根据对话偏好调整风格。同时,模型更关注会话历史与用户偏好,提升个性化与长期交互体验,助力 AI 助手真正走入日常工作与生活。
全面开放策略,赋能开发者与企业
GPT-5 已对所有 ChatGPT 用户开放,免费用户亦可体验核心能力:
Plus 用户每月 $20 可获得更高使用额度;
Pro 用户每月 $200 可访问 GPT-5 Pro 模型与更大计算资源;
开发者 API 提供 gpt-5、gpt-5-mini、gpt-5-nano 三种规格,灵活适应不同业务需求,按 token 计费起步价为每百万输入词元 $1.25,输出词元 $10。
对 HR 科技的深远影响
对于 HR 科技行业而言,GPT-5 的发布意味着:
招聘流程将更加智能化,实现从 JD 编写到简历筛选、面试问题生成的全链路自动化;
合规培训、政策解释、员工沟通等复杂任务可借助 GPT-5 实现快速生成与多语言支持;
企业内部的 AI 助手不再是概念,而是切实可用的生产力工具,推动 HR 数字化转型向深水区迈进。
OpenAI 用 GPT-5 展现了生成式 AI 的另一种可能:不仅聪明,更安全、更懂业务、更可控。这或将成为未来 HR Tech 领域,乃至所有企业级软件的核心驱动力量。
-
reasoning
时代变革:首位AI软件工程师Devin,面试成功入职且接过实际工作的单
在人工智能和软件开发的快速演进中,我们迎来了一个划时代的成就:首个AI软件工程师 Devin诞生。Devin不仅仅是一个程序,它是全球首个完全自主的AI软件工程师,这一突破性的技术由Cognition这个专注于提高技术推理和计划能力的应用AI实验室推出。(介绍视频可以访问视频号:HRTech 或者 抖音HRTech 均可)
Devin的能力超越了以往所有的界限。它在SWE-Bench编码基准测试中展现出非凡的性能,以高达13.86%的成功率解决了真实世界中的GitHub开源项目问题,远远超出以往模型的表现。Devin的出现不仅改变了编码工作的方式,更重塑了软件工程的未来。
与传统的软件工程师相比,Devin具备独立执行复杂编程任务的能力,能够使用开发者工具、代码编辑器和网页浏览器等,完全在一个安全的计算环境中自主工作。这意味着,Devin能够学习新技术、发现并修复程序错误、开发和部署应用程序、甚至对机器学习模型进行微调。
引入Devin这样的AI工程师,意味着人类工程师可以将更多时间和精力投入到创新和战略规划上,从而推动软件开发工作的效率和创造力。Devin的加入,预示着一个由人机协作驱动的新时代即将来临。
随着Devin进入早期访问阶段,Cognition邀请更多的工程师和团队来体验这种新型的工作模式,开启了技术行业的新篇章。这不仅是对AI技术和软件开发领域的一次重大创新,也为未来的工作方式提供了新的思路。
而对于人力资源领域,Devin的出现也带来了深远的影响。首先,人力资源专业人员需要重新考虑人才招聘和团队组建的标准。AI技术的融入意味着寻找能够与智能系统协作、适应新技术的人才变得更加重要。
此外,人力资源部门需要思考如何为员工提供学习和适应新技术的机会,确保团队能够充分利用AI工具如Devin,提高工作效率和创新能力。培训和发展计划将需要更新,以包括AI技术和人机协作的元素。
最后,人力资源管理者应该积极拥抱这一变革,通过教育和引导,帮助团队成员理解并适应AI带来的变化。通过这种方式,人力资源专业人员不仅能够帮助自己的团队顺利过渡到新的工作模式,同时也能确保公司能够在AI时代保持竞争力。
总之,Devin的诞生不仅是技术领域的一次飞跃,也是对工作方式和人力资源管理带来的深刻思考和挑战。在这个变化的时代,适应和创新将是走向成功的关键。
扫一扫 加微信
hrtechchina