辽阳市网站建设_网站建设公司_小程序网站_seo优化
2026/1/15 22:17:14 网站建设 项目流程

OpenAI联合创始人Andrej Karpathy近期发布了2025年终LLM回顾。Andrej是当今全球 AI 领域最具影响力的科学家、教育家和布道者之一。如果说奥特曼(Sam Altman)是 OpenAI 的商业大脑,那么 Karpathy 则是许多开发者心中 AI 技术的“灵魂导师”。2015 年,他与马斯克、奥特曼等人共同创立了 OpenAI。作为早期核心研究员,他深度参与了深度学习算法的早期突破。2017 年受马斯克邀请加入特斯拉,主导了Autopilot(自动驾驶)视觉团队。他彻底改变了特斯拉的技术路径,取消了雷达,推行基于纯视觉(Vision-only)的神经网络架构。师从著名学者李飞飞。他在斯坦福开创并教授了CS231n(卷积神经网络课程),这门课几乎是全球 AI 工程师的“启蒙课”。

2025 年是大模型(LLM)取得突破性进展且极具历史意义的一年。以下是我个人认为最值得关注且略感意外的几个“范式转变”——这些变化从概念上改变了行业版图。

1. 基于可验证奖励的强化学习 (RLVR)

在 2025 年初,各大实验室的 LLM 生产堆栈基本遵循以下路径:

预训练(2020 年左右的 GPT-2/3)

指令微调 (SFT)(2022 年左右的 InstructGPT)

人类反馈强化学习 (RLHF)(2022 年左右)

这曾是长期以来训练生产级模型的“黄金准则”。但在 2025 年,可验证奖励强化学习 (RLVR)正式成为这一组合中的核心新阶段。通过在可自动验证奖励的环境(如数学、代码谜题)中训练模型,LLM 自发地产生了人类眼中的“推理”策略:它们学会了将问题拆解为中间步骤,并在反复尝试中修正错误(参考 DeepSeek R1 论文)。在旧范式中,这些策略极难实现,因为我们并不清楚对模型而言最优的推理路径是什么——而在 RLVR 中,模型通过优化奖励自行找到了行之有效的方法。

与计算量较小的 SFT 和 RLHF 不同,RLVR 针对客观、不可作弊的奖励函数进行训练,允许进行超长周期的优化。事实证明,RLVR 的“能力/成本比”极高,它吞噬了原本用于预训练的算力。因此,2025 年的大部分能力提升源于实验室对这一新阶段潜力的挖掘——模型尺寸变化不大,但强化学习(RL)的运行时间变长了。此外,这一阶段带来了一个全新的变量:测试时算力(Test-time Compute)。通过生成更长的推理痕迹、增加“思考时间”,模型能力随算力按比例扩展。OpenAI o1 (2024年末发布)是 RLVR 的首次演示,而 2025 年初 o3 的发布则是直观感受这种差异的转折点。

2. “幽灵”与“动物” / 参差不齐的智能 (Jagged Intelligence)

2025 年,我和整个行业开始直观地理解 LLM 智能的“形状”。我们不是在“培养动物”,而是在“召唤幽灵”。LLM 的堆栈(神经架构、数据、算法尤其是优化压力)与生物完全不同,因此产生了一种异于动物的智能实体。从监督信息的比特位来看,人类大脑是为了丛林生存而优化的,而 LLM 则是为了模仿人类文本、解决数学题以及在 LM Arena 榜单上获得人类的点赞而优化的。

在可验证领域(RLVR 可触达的地方),LLM 的能力会突飞猛进,表现出**“参差不齐(Jagged)”**的特征:它可能同时是一个全知全能的博学者,又是一个会在简单逻辑陷阱中翻车、轻易被越狱攻击套出数据的懵懂小学生。

这也导致我在 2025 年对榜单(Benchmarks)失去了信任。核心问题在于,榜单本质上就是可验证环境,因此极易受到 RLVR 或合成数据的渗透。当一个模型刷爆所有榜单却依然没达到通用人工智能(AGI)时,我们才真正理解了智力的复杂性。

3. Cursor / LLM 应用的新层级

Cursor 的崛起揭示了 LLM 应用的一个新层级——人们开始谈论“各行各业的 Cursor”。正如我在 YC 演讲中所述,这类应用不仅是套壳,它们:

负责上下文工程 (Context Engineering)

编排复杂的DAG(有向无环图)来平衡性能与成本

提供特定领域的交互界面

提供**“自动化滑块”**

2025 年的一个争论点在于:这一应用层究竟有多厚?我认为 LLM 实验室会培养出“全能大学生”,而 LLM 应用则通过私有数据、传感器和反馈回路,将这些大学生转化为各行业的“资深专家”。

4. Claude Code / 活在电脑里的 AI

Claude Code (CC) 是第一个令人信服的LLM Agent(智能体)演示。它能通过循环的工具调用和推理解决复杂问题。更重要的是,它运行在你的本地环境 (Localhost),拥有你的私有数据、秘钥和配置。Anthropic 意识到,Agent 的核心不在于云端算力,而在于与本地环境的低延迟交互。CC 改变了 AI 的形象:它不再是一个像 Google 那样的网站,而是一个“住”在你电脑里的数字灵魂。

5. 氛围编程 (Vibe Coding)

2025 年,AI 跨越了能力门槛,人们可以仅凭英语构建出令人惊叹的程序,甚至完全忘记代码的存在。我随口提出的“氛围编程 (Vibe Coding)”概念席卷了行业。编程不再是专业人士的特权,而是每个人都能拥有的超能力。 在这种模式下,代码变得廉价、临时且易耗。我曾为了找一个 Bug 随手构建一个一次性的 App。氛围编程正在重塑软件开发的景观和职业定义。

6. Nano Banana / LLM 时代的图形界面

Google Gemini Nano Banana 是 2025 年最具典范意义的模型。LLM 是继 70、80 年代计算机之后的下一次计算范式。我们正在经历从“命令行(文本对话)”向“图形界面(GUI)”的进化。人类并不爱读长文本,人们更喜欢视觉和空间化的信息。 未来的 LLM 应该直接输出图像、信息图、白板动画或 Web 应用。Nano Banana 展示了这种文本、图像与世界知识融合后的原生生成能力。

2025 年是激动人心的一年。LLM 正在进化为一种新型智能——它比我预想的更聪明,同时也更愚笨。目前行业挖掘出的潜力还不足其 10%。系好安全带,未来才刚刚开始。

原文链接:https://karpathy.bearblog.dev/year-in-review-2025/

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线科技企业深耕十二载,见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事,早已在效率与薪资上形成代际优势,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。我们整理出这套AI 大模型突围资料包

  • ✅ 从零到一的 AI 学习路径图
  • ✅ 大模型调优实战手册(附医疗/金融等大厂真实案例)
  • ✅ 百度/阿里专家闭门录播课
  • ✅ 大模型当下最新行业报告
  • ✅ 真实大厂面试真题
  • ✅ 2025 最新岗位需求图谱

所有资料 ⚡️ ,朋友们如果有需要《AI大模型入门+进阶学习资源包》下方扫码获取~

① 全套AI大模型应用开发视频教程

(包含提示工程、RAG、LangChain、Agent、模型微调与部署、DeepSeek等技术点)

② 大模型系统化学习路线

作为学习AI大模型技术的新手,方向至关重要。 正确的学习路线可以为你节省时间,少走弯路;方向不对,努力白费。这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划,带你从零基础入门到精通!

③ 大模型学习书籍&文档

学习AI大模型离不开书籍文档,我精选了一系列大模型技术的书籍和学习文档(电子版),它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础。

④ AI大模型最新行业报告

2025最新行业报告,针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

⑤ 大模型项目实战&配套源码

学以致用,在项目实战中检验和巩固你所学到的知识,同时为你找工作就业和职业发展打下坚实的基础。

⑥ 大模型大厂面试真题

面试不仅是技术的较量,更需要充分的准备。在你已经掌握了大模型技术之后,就需要开始准备面试,我精心整理了一份大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余

以上资料如何领取?

为什么大家都在学大模型?

最近科技巨头英特尔宣布裁员2万人,传统岗位不断缩减,但AI相关技术岗疯狂扩招,有3-5年经验,大厂薪资就能给到50K*20薪!

不出1年,“有AI项目经验”将成为投递简历的门槛。

风口之下,与其像“温水煮青蛙”一样坐等被行业淘汰,不如先人一步,掌握AI大模型原理+应用技术+项目实操经验,“顺风”翻盘!

这些资料真的有用吗?

这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。

以上全套大模型资料如何领取?

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询