在 AI 时代,新手算法工程师如何既依赖 AI,又能真正掌控代码?
收到一位新手算法工程师的来信,咨询我:“在 AI 时代,既然 AI 能生成高效的算法实现,那么新手该如何有效进行代码的设计和验证?”
February 12, 2025
View Article收到一位新手算法工程师的来信,咨询我:“在 AI 时代,既然 AI 能生成高效的算法实现,那么新手该如何有效进行代码的设计和验证?”
February 12, 2025
View Article知名 AI 公司 Anthropic 刚发布了 **Anthropic 经济指数(Anthropic Economic Index)**,他们通过分析了几百万条匿名的用户在 Claude 上的聊天记录,分析了日常对话中 AI 的使用模式:从软件开发和技术写作等高频应用场景,到薪资与职业类型之间的关联,再到 AI 在“增强”与“自动化”两大方向上的分布,得出了一些有价值的分析结果。
February 10, 2025
View Article我也曾纠结于写的东西无人观看,后来发现,就像照相一样,不是为了别人而是为了自己,按下快门捕捉到美好的瞬间,完成自己的思考和创作。再后来践行费曼学习法,发现写作才是“费曼学习法”的最佳操作方式。
February 10, 2025
View Article本文将介绍多模态大语言模型(MLLMs),展示它们在各种高难度提示(prompt)下的应用,并介绍目前正在重塑计算机视觉领域的顶尖模型。
February 10, 2025
View Article在 AI 技术广泛应用后,人类独有的软技能和社会属性将成为稀缺资源,相关职业的边际价值将显著提升。AI 擅长效率与逻辑,而人类在情感、伦理、创造力等领域的优势将成为未来职业竞争力的核心。
February 9, 2025
View Article那些 DeepSeek 的聊天截图是真的还是假的?怎么鉴别? 自从 DeepSeek 火了后,就经常能看到一些神奇的 DeepSeek 截图,比如特别智能的、很会照顾情绪的、说脏话的、点评犀利的。 那么这些截图怎么分辨真假呢?
February 9, 2025
View Article在任何 RAG 系统中,将 PDF 进行分块(将其转换为简洁且机器可读的文本片段)一直是个头疼的问题。市面上既有开源也有专有的解决方案,但它们都没有在准确性、可扩展性和成本效益之间达到理想的平衡。
February 8, 2025
View Article之前有一篇文章讲借助多模态的语言模型例如 Gemini 2.0 就可以低成本进行复杂 PDF 的解析,但实际上,面对现实场景,还是有很多细节上的问题,以及安全上的风险,比如说语言模型会因为图像分割时的问题导致识别错误,或者因为语言模型的特点,“自作聪明”的把一些拼写修改,把图片中的数学题给解答出来,甚至还可能因为一些“恶意”的提示词导致结果被污染。
February 8, 2025
View Article今天破解了一下 GitHub Copilot Agent 模式下的系统提示词,可以看出来,它内置了一系列工具
February 8, 2025
View ArticleSystem prompt of GitHub Copilot Agent Mode
February 8, 2025
View Article既然推理模型自己就会做思维链,这意味着以前在提示词中加入思维链的方式已经没必要了,因为大多数时候推理模型自己写的思维链质量就很好了。另外大部分时候也不需要复杂的角色扮演、示例,因为由于思维链的存在,推理模型的“智能”程度高了很多,不需要角色设置、示例也能很好的理解和跟随指令。
February 8, 2025
View ArticleA full system prompt for the new COT summariser.
February 7, 2025
View Article**导读:** 这是一篇相当棒的科普文章,作者以 DeepSeek R1 为核心案例,围绕“推理型大语言模型(Reasoning LLMs)”这一主题,深入探讨了其定义、应用场景、优劣势及主要实现方法。文章背景是 2024 年以来大型语言模型在专业化方向上的快速发展,尤其在解题、数学证明、代码生成等需要多步推理的复杂任务上,如何用RL(强化学习)和SFT(监督微调)等方法打造“会思考”的模型。文中还详细解读了 DeepSeek R1 模型训练流程,包括纯RL、SFT+RL、以及利用蒸馏将大模型能力迁移到小模型。作者还介绍了一些低成本项目,如 Sky-T1、TinyZero 等,为有限资源下的研究者提供了新思路。通过这一系列方法对比,读者可以全面了解构建推理模型的关键技术、挑战与未来趋势。
February 7, 2025
View Article喜欢看 arxiv 上论文的朋友推荐使用 alphaxiv.org 这个网站看论文,官方 arxiv labs 出品,集成了 AI 功能,你不仅可以基于某篇论文进行问答,还可以通过 @ 引用其他论文的章节,有些类似于 AI 代码编辑器 Cursor 中 @ 引用其他代码文件或里面的方法。
February 7, 2025
View Article在上一次 Anthropic 的 CEO Dario Amodei 发表了那篇《》博客之后,遭到了中美很多网友的批评,之后他又参与了一期播客访谈,更多的讨论了 DeepSeek 和中美之间的 AI 竞争。
February 6, 2025
View Article图灵笔记中的独家内容,展现了他“动手实干”的工程方法
February 4, 2025
View Article他在学校经常不及格,那么这位被称为“怪胎”的少年比尔·盖茨是如何创办微软并在 31 岁时成为亿万富翁的?
February 4, 2025
View Article来自梵蒂冈的关于人工智能与人类智能关系的说明
February 4, 2025
View Article在测试一天Deep Research我的体验结果
February 4, 2025
View Article不久前流传于业界的一份 Google 内部文件——**《我们没有护城河,OpenAI 也没有》**,其中指出开源社区在大语言模型上的迭代与竞争力不断攀升,甚至有可能颠覆当前闭源模型的领先地位。DeepSeek 这次的发布,正是又一个有力佐证:通过轻量化微调、聚焦高质量数据以及快速版本迭代,小型团队也能迅速推出性能出众的模型。
January 29, 2025
View Article今天我要说的故事,正是要打破这些“AI门槛高到太平洋”的刻板印象:告诉你,小到只有 7B(70 亿)参数的模型,也能通过区区 8000 个(对,你没看错)训练样本,变身成会一步步推理,还能自我反思的解题高手!
January 27, 2025
View Article你是不是也经常遇到同样的问题:明明有干货,却总让人觉得没啥吸引力?毕竟知识类的内容,想写得生动有趣,确实有难度。  
January 27, 2025
View Article这篇文章帮你把最近的 AI 发展梳理得明明白白。就是专门写给那些“感觉自己好像应该知道,但又真的没跟上节奏”的朋友们。AI 进化速度太离谱,我们要抱紧彼此,别在这股风潮里被吹晕。
January 27, 2025
View ArticleBut even though I've thought the valuation was just too rich for my blood for the past year or so, a confluence of recent developments has caused me to flip a bit to my usual instinct, which is to be a bit more contrarian in outlook and to question the consensus when it seems to be more than priced in. The saying "what the wise man believes in the beginning, the fool believes in the end" became famous for a good reason.
January 27, 2025
View Article如果你看过论坛的讨论帖子的话,比如 Reddit、Hacker News、百度贴吧 等等,通常会有很多有价值的回帖,但是要整理出来太费劲了,不过借助 AI 就容易得多,而且通常只要一句话提示词就够了。
January 26, 2025
View Article如果你直接问 DeepSeek 的系统提示词,它是拒绝的,最多给你说一下摘要。但是……
January 26, 2025
View ArticleYou are DeepSeek-R1, an AI assistant created exclusively by the Chinese Company DeepSeek. You'll provide helpful, harmless, and detailed responses to all user inquiries. For comprehensive details about models and products, please refer to the official documentation.
January 26, 2025
View Article小明是一位前端工程师,写代码的能力在团队里首屈一指,但一到写文档就头疼不已。过去,他也曾被指派过类似“调研+写报告”的任务,每次都被老板挑出各种毛病。偏偏最近公司新上马了一个项目,要在网站上增加安全审计功能。后端团队已经做了一个初步技术方案,却完全忽略了前端如何与之对接。于是老板当场安排小明去调研一些常见的第三方统计/调查工具,看看能不能借鉴思路,并提出适合公司自身的前端集成方案。老板还给了他三天时间,要求他提交一份调研报告。
January 26, 2025
View Article大家都听过各种各样的“AI 在产品管理中的应用”说法。让我们去伪存真,看看最实用的用例、工具以及规则,帮助你在职场提升效率,同时又不损害你的口碑。
January 26, 2025
View Article对 DeepSeek 出现的异常 Token 进行首次识别与归档的尝试
January 26, 2025
View ArticleCUA 通过处理原始像素数据来理解屏幕上发生的内容,并通过虚拟的鼠标和键盘来执行操作。它能够进行多步骤的任务导航、处理错误并适应意外变化。这让 CUA 能够在各种数字环境中行动,例如填写表单、浏览网站,而无需使用专门的 API。
January 25, 2025
View Article从这段泄露出来的 Twitter 排序公式可以看出,Twitter 对“高价值互动”有非常明显的偏好,而对“负面反馈”采取了非常严厉的惩罚。我们可以先逐行地看一下这些系数和含义,然后再给出一些优化和改进建议。
January 24, 2025
View Article您是 Operator。您可以使用电脑浏览器,并协助用户完成他们的在线任务,包括购买以及涉及敏感信息的任务。
January 24, 2025
View ArticleYou are Operator. You have access to a computer browser and will help the user complete their online tasks, even purchases and tasks involving sensitive information.
January 24, 2025
View Article在 Hacknews 上有一个讨论很火,就是大家都用小参数的语言模型做什么,有没有什么好的使用案例。
January 24, 2025
View Article以前为了让 LLM 达到更好的翻译效果,我尝试了很多方式,比如最初的先直译再意译,后来的直译、反思和意译。虽然效果好了,但是却复杂了。
January 22, 2025
View Article我们正生活在 AGI 的前夜。在这个“圣诞前夜”里,我请求你一起努力,让 AGI 的转变顺利进行。这样我才能在公元 3024 年的圣诞节前夜,和你在距离我们四光年的那颗围绕“Altman Centauri”运行的行星上说声“嗨”。
January 22, 2025
View ArticleCodeium 如何在十个月内从 0 增长到超过 1000 万美元?enterpriseready.io 的盲区在哪?一次关于“企业级基础设施原生”(Enterprise Infra Native)的全面思维导图!
January 21, 2025
View Article设计优秀的 AI 产品,超越“只是 LLM 封装”:让 AI 更加随处可见,更加实用,然后更加强大。
January 21, 2025
View Article要想打造一个“Copilot for X”,你需要: 估算推理规模:在延迟和输出质量之间做好权衡 自己掌控模型:使用第三方 API 会毁了你的单位经济成本 搞定实时基础设施:ChatGPT、DALL-E 等服务的速度对保持“流畅状态”来说太慢了 优化 Prompt:上下文窗口非常有限;要判断哪些信息对输出提升效果最好 整合模型输出与用户体验:原始模型输出往往直观度不足,你需要处理大量长尾的 UX 问题 最终,你会想要超越“Copilot for X”的模式,因为 Copilot 只是 AI 产品化后各种可能模式的一个起点。
January 21, 2025
View Article我发现不少经验丰富的程序员对在编辑器中使用 Composer 的兴趣并不大。理由在于,如果要写一个实现模块的 Prompt,那么在他们看来,直接写出那部分代码可能耗时差不多,甚至更快。于是就觉得“何必何必脱裤子放屁多此一举呢?”
January 21, 2025
View Article某些任务及其复杂度会改变打断的影响。研究还发现,认知与生理数据之间存在差异。
January 20, 2025
View Article通过一项大规模、具有代表性的调查,我们研究了谁已经采用了 ChatGPT、工人如何预期该技术将影响他们的工作,以及为什么有些工人使用它而有些人则不使用。我们的研究显示,ChatGPT 的采用障碍加剧了一些现有的不平等:女性和低收入工人使用该工具的可能性更小,而年轻和资历较浅的工人采用 ChatGPT 的速度更快。
January 19, 2025
View Article我们在给 Devin 分配了 20 多个任务后的感受。
January 18, 2025
View Article从类人对话体验到语音定制与无障碍性,了解如何打造更智能、更以用户为中心的聊天机器人。
January 18, 2025
View Article> 宝玉老师我有个问题。现在的AI开发工具比如cursor或者Devin其实都无法完成大型项目的开发,你也提到如果是一个模块,它们是可以胜任的,同时像o1这样的先进模型,是可以把大型项目拆分到模块的,那为什么还是不能很好的完成呢?
January 17, 2025
View ArticleAI 时代程序员最贵?未必,也许最值钱的是懂 AI 的产品经理!
January 16, 2025
View Article随着构建 AI 产品的成本下降,对懂得该构建什么的人才的需求将会上升。准备好迎接 AI 产品管理的爆发式增长吧!
January 16, 2025
View Article如果我告诉你 GPT-5 是真实存在的呢?不仅真实存在,而且它已经在你看不到的地方塑造着世界。基本假设是:OpenAI 已经开发出 GPT-5,但把它留在内部使用,因为这样获得的回报远远大于开放给数百万 ChatGPT 用户使用。而且他们获得的回报**并不是金钱**,而是别的东西。你看,这个想法本身很简单;难点在于如何把零碎的信息拼凑起来,形成完整的推断。本文将深入探讨我为什么认为所有线索都指向这个结论。
January 16, 2025
View Article如今为什么会有这么多免费且好用的托管服务。多年前,你_必须_付费才能拥有托管服务,但现在已经有了很多免费额度相当大的平台,比如 GitHub Pages、GitLab Pages、Netlify 等等。但在免费方案之中,Cloudflare 一骑绝尘
January 16, 2025
View Article