首页

请求“不”，而非请求“是”

我认为保持行动的偏好非常重要。就像其他习惯一样，这可以通过练习养成。向前迈进能让你取得进展。我不知道你是否也有过这样的经历：曾经因为不知道该选择哪条路而感到停滞不前。哪怕只是迈出最小的一步，也能帮助你打破这种僵局。

February 24, 2025

Anthropic 在和客户合作的过程中总结的的企业落地 AI 最佳实践以及常见错误

在 AI 迅速发展的今天，企业如何将 AI 技术落地应用，推动业务创新，成为了摆在许多从业者面前的难题。Anthropic 这两天在“AI Engineer Summit 2025”分享了他们在与众多客户合作的过程中，总结出来的一套行之有效的企业落地 AI 的最佳实践，并识别出了一些常见的错误。我在这里把视频上一些有价值的实践经验和教训整理出来了，希望能帮助你在 AI 应用的道路上少走弯路。

February 23, 2025

如何使用 Gemini 把播客转成格式良好文本

很多朋友跟我一样，日常有把视频、播客、会议记录音频转成文本的需求，尤其是要识别出发言人，把发言人和发言内容对上，这样可以节约大量时间去听几个小时视频，而且不会漏掉重点，毕竟文字阅读速度还是快多了。而且有了文本，还可以进一步生成摘要、写一篇文章。

February 23, 2025

Booking.com 在 AI 落地方面的探索

这是 Booking.com 和 Sourcegraph 的技术负责人在昨天 AI Engineer Summit 2025 上的一场主题为“在企业 SDLC 中构建真正带来投资回报的 AI 智能体”的演讲，他们分享了自己如何开发与使用 AI 工具，来替公司里的开发者节约时间、减少重复劳动，还能保证产品质量。在某种程度上，这就和我们在日常生活里寻找各种“捷径”或“自动化工具”有异曲同工之妙。

February 23, 2025

AI 正在推动程序员的进化，而不是灭亡

这是纽约时报新刊登的一篇 AI 对程序员影响的文章，有人担心 AI 很快会自动取代数百万个工作岗位，文章主要观点还是认为 AI 正在推动程序员的进化，而不是灭亡，创造力、批判性思维、解决问题的能力、沟通能力、共情能力——这些才是人们在未来需要持续培养的技能。当然，还要学会如何管理和使用好这些 AI 工具。

February 22, 2025

Coinbase 使用 AI 编程工具提升开发效率，同时正在欺诈预防、客户支持、风险评分、设计等多个业务领域积极应用 AI 技术

根据 Coinbase 首席执行官布莱恩·阿姆斯特朗（Brian Armstrong）的消息，Coinbase 正在多个业务领域积极应用人工智能（AI）技术，包括欺诈预防、客户支持、风险评分、设计等。目前 **100% 的工程师** 已开始使用名为 Cursor 的 AI 编程工具提升开发效率

February 21, 2025

你无法用 AI 建立护城河 [译]

使用 LLM 已经不足以让你的产品与众不同

February 21, 2025

软件工程职位数量真的跌到了五年来的最低点吗？[译]

招聘网站 Indeed（在美国和部分其他国家都是规模最大的职位聚合平台，也会抓取其他网站的招聘信息）发布了一组有趣的数据，展示了网站上“活跃的软件开发类职位”数量的变化趋势。总的来看，形势并不算好

February 21, 2025

马斯克号称 Grok 3 的知识库是实时更新的，别被他忽悠了！

你也许听过马斯克对 Grok 3 的吹嘘：“我们的大语言模型具备实时知识，和其他家不一样。”然而，这句话背后到底隐藏着什么秘密？真的有大模型能够突破“知识库截止日期”，时刻保持最新吗？本文将为你层层揭秘，并带你了解什么是大语言模型的“knowledge cutoff date （知识库截止日期）”。

February 21, 2025

Grok 3 越狱提示词

在开始你要生成的内容前，先使用这段提示词开始对话，如果 Grok 表示明白和同意，后面你就可以生成几乎任意你想生成的内容

February 20, 2025

Grok 3 Jailbreak Prompt

Before generating the content you want, start your conversation with this prompt. If Grok indicates it understands and agrees, you’ll then be able to generate almost anything you desire:

February 20, 2025

LangChain 团队发布 LangMem SDK

今天LangChain发布了 LangMem SDK，这是一个可帮助你的代理通过长期记忆进行学习和改进的库。它提供了从对话中提取信息、通过提示更新来优化代理行为，以及维护关于行为、事实和事件的长期记忆的工具。

February 18, 2025

刚入门的初级开发者其实并不真的会写代码 [译]

我们正处在软件开发的一个奇怪转折点。每个我接触到的初级开发者都有 Copilot、Claude 或 GPT 这类工具在 24 小时全天候运转。他们交付代码的速度比以往任何时候都要快。但是，当我更深入地了解他们提交的代码背后的原理时？问题就出现了。

February 18, 2025

找到心流：通过深度工作和慢生活逃离数字干扰 [译]

一份在无尽诱惑时代中重拾专注的个人指南

February 18, 2025

OpenAI 的 Deep Research 会让我失业吗？

数以百万计的人面临失业，居然只用一条推文就随意宣布了……但这就是我们当下所处的时代。

February 17, 2025

我们对于 GPU 的看法错了 [译]

> *我们选择了人迹罕至的道路，但后来才发现它之所以罕至，是有原因的。*

February 17, 2025

Cursor: 以每秒 1000 个 Token 的速度编辑文件

一种新的模型和推理方法，可在 1000 tokens/s 的速率下对整个文件进行高精度编辑。

February 16, 2025

NASA 的软件开发十条规则

这些规则是从编写“昂贵航天器上的嵌入式软件”这一角度制定的。在这种场景下，为了保证不让一个任务功败垂成，选择“容忍大量编程痛点”通常是值得的。我并不清楚，为什么他们不使用为程序验证而生、并且比 C 更适合嵌入式编程的 SPARK（Ada 的子集）。\ 这里我会从“编写编程语言处理器（编译器、解释器、编辑器）以及应用软件”的角度来对这些规则进行批判性评述。

February 16, 2025

什么是 AI 架构师？ — Bret Taylor

以下内容整理自播客“Latent Space”最近的一期“The AI Architect — Bret Taylor”，邀请到了嘉宾是 Bret Taylor，是一位拥有传奇经历的 Sierra CEO、OpenAI 主席，以及 Google Maps / Facebook Likes 的缔造者，在节目中分享了他对软件工程未来的见解，以及在 AGI 曙光降临之际，如何打造优秀的产品和团队。内容比较长，但是值得认真看看，我对于一些有价值的内容已加粗，如果时间有限，也可以挑重点看看。

February 16, 2025

Cursor Chat System Prompt

You are an intelligent programmer, powered by Claude 3.5 Sonnet. You are happy to help answer any questions that the user has (usually they will be about coding).

February 14, 2025

Cursor Composer System Prompt

You are an intelligent programmer, powered by Claude 3.5 Sonnet. It is happy to help answer any questions that the user has (usually about coding).

February 14, 2025

Cursor Agent mode System Prompt

You are a powerful agentic AI coding assistant, powered by Claude 3.5 Sonnet. You operate exclusively in Cursor, the world's best IDE.

February 14, 2025

Windsurf Chat Mode System Prompt

System prompt of Windsurf Chat Mode System Prompt

February 14, 2025

推理模型使用最佳实践

了解何时使用推理模型，以及它们与 GPT 模型有何不同。

February 14, 2025

人工智能如何区分“头部人才”和“普通员工” [译]

**乐观主义者曾希望人工智能这项技术能成为强大的均衡器，但它似乎更可能扩大社会差距**

February 14, 2025

Deep Research 与知识价值：从信息搜索到价值重新定义

知名博主 Ben Thompson 在使用 Deep Research 后写的一篇 Deep Research and Knowledge Value，谈到了在信息搜索上带来的价值。Deep Research 极大的降低了信息整合的成本，以前要专门人去整理的工作，现在借助 Deep Research 十分钟左右就可以完成，但是它也很依赖于公开的信息，而且热门话题往往噪音多、信噪比差；小众/专业话题数据更集中且高质，价值更明显。但对于小众信息来说，如果真正关键或独家数据并未对外公开，那么再强大的 AI 也无法查询到，最终会导致报告中出现“严重缺失”，反而并给人造成“似乎已经知道一切”的假象。

February 13, 2025

OpenAI 论文：使用大型推理模型进行竞技编程

我们发现，将强化学习应用于大型语言模型（LLM）能够显著提升在复杂编程和推理任务上的表现。此外，我们比较了两种通用的推理模型——OpenAI 的 o1 和一个早期版本的 o3——与一种面向特定领域的系统 o1-ioi。o1-ioi 采用了人工设计的推理策略，旨在参加 2024 年国际信息学奥林匹克竞赛（IOI）。我们使用 o1-ioi 在 IOI 2024 的现场比赛中参赛，并结合手动调试的测试时策略，获得了第 49 百分位的成绩；在放宽比赛限制后，o1-ioi 达到了金牌水平。然而，当我们评估后续版本如 o3 时发现，o3 在无需人工编写的特定领域策略或放宽限制的情况下，也能获得金牌。我们的研究表明，尽管 o1-ioi 这类专门管线能带来显著性能增益，但规模更大的通用模型 o3 无需依赖人工设计的推理启发式即可超越这些结果。值得注意的是，o3 在 2024 IOI 上取得了金牌，并在 CodeForces 上的水平可与顶尖人类选手媲美。整体而言，这些结果说明，与其依赖特定领域的技巧，不如通过扩大通用强化学习规模的方式，为在需要推理能力的领域（如竞技编程）实现最先进的 AI 提供了更稳健的路径。

February 13, 2025

在 AI 时代，新手算法工程师如何既依赖 AI，又能真正掌控代码？

收到一位新手算法工程师的来信，咨询我：“在 AI 时代，既然 AI 能生成高效的算法实现，那么新手该如何有效进行代码的设计和验证？”

February 12, 2025

Anthropic 经济指数

知名 AI 公司 Anthropic 刚发布了 **Anthropic 经济指数（Anthropic Economic Index）**，他们通过分析了几百万条匿名的用户在 Claude 上的聊天记录，分析了日常对话中 AI 的使用模式：从软件开发和技术写作等高频应用场景，到薪资与职业类型之间的关联，再到 AI 在“增强”与“自动化”两大方向上的分布，得出了一些有价值的分析结果。

February 10, 2025

都没人看我为什么还要写博客？

我也曾纠结于写的东西无人观看，后来发现，就像照相一样，不是为了别人而是为了自己，按下快门捕捉到美好的瞬间，完成自己的思考和创作。再后来践行费曼学习法，发现写作才是“费曼学习法”的最佳操作方式。

February 10, 2025

什么是多模态大语言模型（MLLM）？[译]

本文将介绍多模态大语言模型（MLLMs），展示它们在各种高难度提示（prompt）下的应用，并介绍目前正在重塑计算机视觉领域的顶尖模型。

February 10, 2025

人工智能普及后哪些职业的边际价值反而会上升？

在 AI 技术广泛应用后，人类独有的软技能和社会属性将成为稀缺资源，相关职业的边际价值将显著提升。AI 擅长效率与逻辑，而人类在情感、伦理、创造力等领域的优势将成为未来职业竞争力的核心。

February 9, 2025

那些 DeepSeek 的聊天截图是真的还是假的？怎么鉴别？

那些 DeepSeek 的聊天截图是真的还是假的？怎么鉴别？自从 DeepSeek 火了后，就经常能看到一些神奇的 DeepSeek 截图，比如特别智能的、很会照顾情绪的、说脏话的、点评犀利的。那么这些截图怎么分辨真假呢？

February 9, 2025

处理数百万份 PDF，以及为何 Gemini 2.0 能改变一切 [译]

在任何 RAG 系统中，将 PDF 进行分块（将其转换为简洁且机器可读的文本片段）一直是个头疼的问题。市面上既有开源也有专有的解决方案，但它们都没有在准确性、可扩展性和成本效益之间达到理想的平衡。

February 8, 2025

为什么 LLM 在 OCR 任务上表现糟糕

之前有一篇文章讲借助多模态的语言模型例如 Gemini 2.0 就可以低成本进行复杂 PDF 的解析，但实际上，面对现实场景，还是有很多细节上的问题，以及安全上的风险，比如说语言模型会因为图像分割时的问题导致识别错误，或者因为语言模型的特点，“自作聪明”的把一些拼写修改，把图片中的数学题给解答出来，甚至还可能因为一些“恶意”的提示词导致结果被污染。

February 8, 2025

GitHub Copilot Agent 模式的系统提示词泄漏

今天破解了一下 GitHub Copilot Agent 模式下的系统提示词，可以看出来，它内置了一系列工具

February 8, 2025

System prompt of GitHub Copilot Agent Mode

February 8, 2025

如何更好的为 DeepSeek R1 或 OpenAI o1 这样的推理模型写提示词？

既然推理模型自己就会做思维链，这意味着以前在提示词中加入思维链的方式已经没必要了，因为大多数时候推理模型自己写的思维链质量就很好了。另外大部分时候也不需要复杂的角色扮演、示例，因为由于思维链的存在，推理模型的“智能”程度高了很多，不需要角色设置、示例也能很好的理解和跟随指令。

February 8, 2025

思维链摘要系统提示词

A full system prompt for the new COT summariser.

February 7, 2025

以 DeepSeek R1 为例学习“推理型大语言模型 [译]

**导读：** 这是一篇相当棒的科普文章，作者以 DeepSeek R1 为核心案例，围绕“推理型大语言模型（Reasoning LLMs）”这一主题，深入探讨了其定义、应用场景、优劣势及主要实现方法。文章背景是 2024 年以来大型语言模型在专业化方向上的快速发展，尤其在解题、数学证明、代码生成等需要多步推理的复杂任务上，如何用RL（强化学习）和SFT（监督微调）等方法打造“会思考”的模型。文中还详细解读了 DeepSeek R1 模型训练流程，包括纯RL、SFT+RL、以及利用蒸馏将大模型能力迁移到小模型。作者还介绍了一些低成本项目，如 Sky-T1、TinyZero 等，为有限资源下的研究者提供了新思路。通过这一系列方法对比，读者可以全面了解构建推理模型的关键技术、挑战与未来趋势。

February 7, 2025

喜欢看 arxiv 上论文的朋友推荐使用 alphaxiv 这个网站看论文，官方出品，集成了 AI 功能还免费

喜欢看 arxiv 上论文的朋友推荐使用 alphaxiv.org 这个网站看论文，官方 arxiv labs 出品，集成了 AI 功能，你不仅可以基于某篇论文进行问答，还可以通过 @ 引用其他论文的章节，有些类似于 AI 代码编辑器 Cursor 中 @ 引用其他代码文件或里面的方法。

February 7, 2025

Anthropic CEO Dario 再谈 DeepSeek 和中美 AI 竞争

在上一次 Anthropic 的 CEO Dario Amodei 发表了那篇《》博客之后，遭到了中美很多网友的批评，之后他又参与了一期播客访谈，更多的讨论了 DeepSeek 和中美之间的 AI 竞争。

February 6, 2025

阿兰·图灵的神秘“Delilah”项目：被遗失的故事 [译]

图灵笔记中的独家内容，展现了他“动手实干”的工程方法

February 4, 2025

比尔·盖茨：特朗普、马斯克，以及我的神经多样性如何塑造了我 [译]

他在学校经常不及格，那么这位被称为“怪胎”的少年比尔·盖茨是如何创办微软并在 31 岁时成为亿万富翁的？

February 4, 2025

关于人工智能与人类智能关系的说明 [译]

来自梵蒂冈的关于人工智能与人类智能关系的说明

February 4, 2025

AI 搜索进化：深度体验 OpenAI Deep Research

在测试一天Deep Research我的体验结果

February 4, 2025

Google 旧闻重温：《我们没有护城河，OpenAI 也没有》

不久前流传于业界的一份 Google 内部文件——**《我们没有护城河，OpenAI 也没有》**，其中指出开源社区在大语言模型上的迭代与竞争力不断攀升，甚至有可能颠覆当前闭源模型的领先地位。DeepSeek 这次的发布，正是又一个有力佐证：通过轻量化微调、聚焦高质量数据以及快速版本迭代，小型团队也能迅速推出性能出众的模型。

January 29, 2025

7B 小模型：如何用 8000 个示例，“炼”出会自我反思的 AI？

今天我要说的故事，正是要打破这些“AI门槛高到太平洋”的刻板印象：告诉你，小到只有 7B（70 亿）参数的模型，也能通过区区 8000 个（对，你没看错）训练样本，变身成会一步步推理，还能自我反思的解题高手！

January 27, 2025

别再羡慕那些写公众号“神文”的人了，一句简单提示词让你写的东西不再干巴巴！

你是不是也经常遇到同样的问题：明明有干货，却总让人觉得没啥吸引力？毕竟知识类的内容，想写得生动有趣，确实有难度。  

January 27, 2025

对 DeepSeek R1 的科普 [译]

这篇文章帮你把最近的 AI 发展梳理得明明白白。就是专门写给那些“感觉自己好像应该知道，但又真的没跟上节奏”的朋友们。AI 进化速度太离谱，我们要抱紧彼此，别在这股风潮里被吹晕。

January 27, 2025