YouTube視界-实测解读GPT52发布74的打工人任务被AI攻克了.html

【实测+解读】GPT5.2发布：74%的打工人任务，被AI攻克了

4,550

2025-12-11

AI进化论花生

今天凌晨，OpenAI发布GPT-5.2模型，仅距离5.1发布不到一个月。这次更新最大的亮点是在GDPval指标上从38.8%暴涨到74.1%——这意味着在74%的知识型工作任务中，AI已经能达到甚至超越拥有14年经验的专家水平。 GDPval是OpenAI提出的全新评估体系，覆盖美国GDP前九大产业的44个职业领域，包括律师、医生、工程师、文员等，测试任务涵盖1,320项真实工作场景。但GPT-5.2 Pro的价格也相当夸张：输出168美元/百万tokens，是DeepSeek的上百倍。本期视频深度解读GPT-5.2的核心能力，并实测对比DeepSeek、Claude 4.5和Gemini 3 Pro，看看谁才是真正的王者。重点时间戳： 00:00 🚀 GPT-5.2发布：一个月内的紧急迭代 00:25 🔥 为什么这么快？Anthropic和Google的压力 01:12 📊 GDPval：衡量AI在真实工作中的新指标 04:45 💼 GDPval任务示例：制造工程师、订单文员 08:18 📈 从38.8%到74.1%：5.2的巨大飞跃 10:00 💻 编程、长文本、视觉能力全面提升 12:33 💰 价格公布：Pro版168美元，太贵了？ 14:09 🧪 实测对比：DeepSeek vs Claude vs Gemini，谁更强？