首页


7B 小模型:如何用 8000 个示例,“炼”出会自我反思的 AI?

今天我要说的故事,正是要打破这些“AI门槛高到太平洋”的刻板印象:告诉你,小到只有 7B(70 亿)参数的模型,也能通过区区 8000 个(对,你没看错)训练样本,变身成会一步步推理,还能自我反思的解题高手!

January 27, 2025

View Article

别再羡慕那些写公众号“神文”的人了,一句简单提示词让你写的东西不再干巴巴!

你是不是也经常遇到同样的问题:明明有干货,却总让人觉得没啥吸引力?毕竟知识类的内容,想写得生动有趣,确实有难度。  

January 27, 2025

View Article

对 DeepSeek R1 的科普 [译]

这篇文章帮你把最近的 AI 发展梳理得明明白白。就是专门写给那些“感觉自己好像应该知道,但又真的没跟上节奏”的朋友们。AI 进化速度太离谱,我们要抱紧彼此,别在这股风潮里被吹晕。

January 27, 2025

View Article

英伟达股票的空头观点简析 [译]

But even though I've thought the valuation was just too rich for my blood for the past year or so, a confluence of recent developments has caused me to flip a bit to my usual instinct, which is to be a bit more contrarian in outlook and to question the consensus when it seems to be more than priced in. The saying "what the wise man believes in the beginning, the fool believes in the end" became famous for a good reason.

January 27, 2025

View Article

一句话提示词,让 AI 帮你总结整理论坛的讨论帖子

如果你看过论坛的讨论帖子的话,比如 Reddit、Hacker News、百度贴吧 等等,通常会有很多有价值的回帖,但是要整理出来太费劲了,不过借助 AI 就容易得多,而且通常只要一句话提示词就够了。

January 26, 2025

View Article

教你如何破解 DeepSeek R1 系统提示词

如果你直接问 DeepSeek 的系统提示词,它是拒绝的,最多给你说一下摘要。但是……

January 26, 2025

View Article

DeepSeek-R1 System Prompt

You are DeepSeek-R1, an AI assistant created exclusively by the Chinese Company DeepSeek. You'll provide helpful, harmless, and detailed responses to all user inquiries. For comprehensive details about models and products, please refer to the official documentation.

January 26, 2025

View Article

小明的烦恼:代码高手,不爱写文档,老板让写调研报告,还好有 AI 帮忙

小明是一位前端工程师,写代码的能力在团队里首屈一指,但一到写文档就头疼不已。过去,他也曾被指派过类似“调研+写报告”的任务,每次都被老板挑出各种毛病。偏偏最近公司新上马了一个项目,要在网站上增加安全审计功能。后端团队已经做了一个初步技术方案,却完全忽略了前端如何与之对接。于是老板当场安排小明去调研一些常见的第三方统计/调查工具,看看能不能借鉴思路,并提出适合公司自身的前端集成方案。老板还给了他三天时间,要求他提交一份调研报告。

January 26, 2025

View Article

The AI PM's Playbook:2025 年顶尖产品经理如何将影响力提升 10 倍 [译]

大家都听过各种各样的“AI 在产品管理中的应用”说法。让我们去伪存真,看看最实用的用例、工具以及规则,帮助你在职场提升效率,同时又不损害你的口碑。

January 26, 2025

View Article

DeepSeek-V3 与 r1 中的异常 Token [译]

对 DeepSeek 出现的异常 Token 进行首次识别与归档的尝试

January 26, 2025

View Article

OpenAI Operator 的工作原理

CUA 通过处理原始像素数据来理解屏幕上发生的内容,并通过虚拟的鼠标和键盘来执行操作。它能够进行多步骤的任务导航、处理错误并适应意外变化。这让 CUA 能够在各种数字环境中行动,例如填写表单、浏览网站,而无需使用专门的 API。

January 25, 2025

View Article

让 o1 pro 帮忙分析了一下 Twitter 的评分算法

从这段泄露出来的 Twitter 排序公式可以看出,Twitter 对“高价值互动”有非常明显的偏好,而对“负面反馈”采取了非常严厉的惩罚。我们可以先逐行地看一下这些系数和含义,然后再给出一些优化和改进建议。

January 24, 2025

View Article

OpenAI Operator 系统提示词(中文翻译)

您是 Operator。您可以使用电脑浏览器,并协助用户完成他们的在线任务,包括购买以及涉及敏感信息的任务。

January 24, 2025

View Article

OpenAI Operator System Prompt

You are Operator. You have access to a computer browser and will help the user complete their online tasks, even purchases and tasks involving sensitive information.

January 24, 2025

View Article

一些“小模型”的使用案例

在 Hacknews 上有一个讨论很火,就是大家都用小参数的语言模型做什么,有没有什么好的使用案例。

January 24, 2025

View Article

一句简单的提示词就可以让 LLM 在翻译的时候更好的“意译”

以前为了让 LLM 达到更好的翻译效果,我尝试了很多方式,比如最初的先直译再意译,后来的直译、反思和意译。虽然效果好了,但是却复杂了。

January 22, 2025

View Article

AGI前夜的思考 [译]

我们正生活在 AGI 的前夜。在这个“圣诞前夜”里,我请求你一起努力,让 AGI 的转变顺利进行。这样我才能在公元 3024 年的圣诞节前夜,和你在距离我们四光年的那颗围绕“Altman Centauri”运行的行星上说声“嗨”。

January 22, 2025

View Article

AI 初创公司最危险的做法:就是为其他 AI 初创公司构建产品 [译]

Codeium 如何在十个月内从 0 增长到超过 1000 万美元?enterpriseready.io 的盲区在哪?一次关于“企业级基础设施原生”(Enterprise Infra Native)的全面思维导图!

January 21, 2025

View Article

如何让 AI 的用户体验(UX)成为你的护城河 [译]

设计优秀的 AI 产品,超越“只是 LLM 封装”:让 AI 更加随处可见,更加实用,然后更加强大。

January 21, 2025

View Article

打造「Copilot for X」究竟需要什么?[译]

要想打造一个“Copilot for X”,你需要: 估算推理规模:在延迟和输出质量之间做好权衡 自己掌控模型:使用第三方 API 会毁了你的单位经济成本 搞定实时基础设施:ChatGPT、DALL-E 等服务的速度对保持“流畅状态”来说太慢了 优化 Prompt:上下文窗口非常有限;要判断哪些信息对输出提升效果最好 整合模型输出与用户体验:原始模型输出往往直观度不足,你需要处理大量长尾的 UX 问题 最终,你会想要超越“Copilot for X”的模式,因为 Copilot 只是 AI 产品化后各种可能模式的一个起点。

January 21, 2025

View Article

写提示词的功夫,代码都写出来了,还有必要用 AI 编程吗?

我发现不少经验丰富的程序员对在编辑器中使用 Composer 的兴趣并不大。理由在于,如果要写一个实现模块的 Prompt,那么在他们看来,直接写出那部分代码可能耗时差不多,甚至更快。于是就觉得“何必何必脱裤子放屁多此一举呢?”

January 21, 2025

View Article

打断如何影响不同的软件工程活动?[译]

某些任务及其复杂度会改变打断的影响。研究还发现,认知与生理数据之间存在差异。

January 20, 2025

View Article

ChatGPT 的不平衡采用加剧了工人之间既有的不平等 [译]

通过一项大规模、具有代表性的调查,我们研究了谁已经采用了 ChatGPT、工人如何预期该技术将影响他们的工作,以及为什么有些工人使用它而有些人则不使用。我们的研究显示,ChatGPT 的采用障碍加剧了一些现有的不平等:女性和低收入工人使用该工具的可能性更小,而年轻和资历较浅的工人采用 ChatGPT 的速度更快。

January 19, 2025

View Article

与 Devin 相处一个月的思考 [译]

我们在给 Devin 分配了 20 多个任务后的感受。

January 18, 2025

View Article

超越机器人:在 AI 时代重新定义聊天机器人设计 [译]

从类人对话体验到语音定制与无障碍性,了解如何打造更智能、更以用户为中心的聊天机器人。

January 18, 2025

View Article

为什么 AI 还不能完成复杂项目?

> 宝玉老师我有个问题。现在的AI开发工具比如cursor或者Devin其实都无法完成大型项目的开发,你也提到如果是一个模块,它们是可以胜任的,同时像o1这样的先进模型,是可以把大型项目拆分到模块的,那为什么还是不能很好的完成呢?

January 17, 2025

View Article

21 世纪什么最贵?人才!AI 时代什么人才最贵?

AI 时代程序员最贵?未必,也许最值钱的是懂 AI 的产品经理!

January 16, 2025

View Article

开发软件成本越来越低,但创意更值钱:AI 产品经理将炙手可热![译]

随着构建 AI 产品的成本下降,对懂得该构建什么的人才的需求将会上升。准备好迎接 AI 产品管理的爆发式增长吧!

January 16, 2025

View Article

这则关于 GPT-5 的传言将改变一切 [译]

如果我告诉你 GPT-5 是真实存在的呢?不仅真实存在,而且它已经在你看不到的地方塑造着世界。基本假设是:OpenAI 已经开发出 GPT-5,但把它留在内部使用,因为这样获得的回报远远大于开放给数百万 ChatGPT 用户使用。而且他们获得的回报**并不是金钱**,而是别的东西。你看,这个想法本身很简单;难点在于如何把零碎的信息拼凑起来,形成完整的推断。本文将深入探讨我为什么认为所有线索都指向这个结论。

January 16, 2025

View Article

为什么 Cloudflare Pages 的免费套餐如此慷慨?[译]

如今为什么会有这么多免费且好用的托管服务。多年前,你_必须_付费才能拥有托管服务,但现在已经有了很多免费额度相当大的平台,比如 GitHub Pages、GitLab Pages、Netlify 等等。但在免费方案之中,Cloudflare 一骑绝尘

January 16, 2025

View Article

AI 创业者需要学习《苦涩的教训》:第二章 - 无护城河 [译]

在大多数垂直领域中,横向 AI 产品最终会胜过垂直 AI 产品。垂直 AI 虽先入市场,但谁能在长期中取胜?

January 16, 2025

View Article

“2025年 AI coding 将如何演进”播客文稿

这场直播深入探讨了AI编程的现状和未来发展,几位专家从不同角度分享了他们的观察和见解。他们既肯定了AI在提升编程效率方面的重要价值,也理性分析了当前AI编程工具的局限性,为开发者们提供了很多实用的建议和启发。同时,他们对未来的展望既充满期待又保持着谨慎的态度,强调了人类开发者在整个软件开发过程中不可替代的重要作用。这场对话不仅有助于开发者们更好地理解和使用AI编程工具,也为整个行业的发展提供了有价值的思考。

January 15, 2025

View Article

一个“退后一步 Step back”的提示词技巧

当模型在生成某些内容时陷入重复、不充分或“死循环”状态时,用来帮助它重新思考并打破僵局的提示词

January 15, 2025

View Article

关于加强美国在人工智能基础设施领域领导地位的行政命令 [译]

关于加强美国在人工智能基础设施领域领导地位的行政命令

January 15, 2025

View Article

非专业程序员借助 AI 能干好专业程序员的活吗?

> “我很好奇现在招聘程序员,还需不需要代码能力非常强的?因为我现在确实代码都是gpt生成的。那我现在代码能力弱,背一背八股文应付面试,然后工作就一直打开gpt行不?”

January 15, 2025

View Article

使用编程技能赚取被动收入 [译]

十年亲身经验:从受雇软件开发者到成功独立开发者,打造并运营自己的业务

January 14, 2025

View Article

o1 pro 值一个月 $200 吗?

o1 pro 值不值这个事很主观,相当于雇了 200 的人给你干活,干的活的价值超过 200 就是值的。

January 14, 2025

View Article

如果我们拥有世界上最好的产品工程组织,它会是什么样子?[译]

2025 年 1 月 8 日的东京地区 Scrum Gathering 大会上所做主题演讲的文字记录。

January 13, 2025

View Article

Mac Mini G4 —— 最佳「经典」Macintosh 来怀旧游戏 [译]

尽管我的第一台电脑是 Apple II,但我从来不是 Macintosh 用户,因为我家后来转用了 PC。不过通过阅读各种杂志,我对 Macintosh 这一系列的电脑也逐渐熟悉,并一直想给收藏添一台运行在 pre-OSX(OS X 之前版本)的 Macintosh。阻碍我的主要原因是,大多数老 Mac 都使用较为“奇葩”的接口,而且我也没有足够的空间来放置它们。

January 13, 2025

View Article

简单有效的将音频转成各式良好对话文本的方案

昨天我花了点时间整理了一下 Twitter Space 音频的文稿:《AI编程革命:代码的未来,由AI重塑!》https://baoyu.io/blog/ai-programming-revolution 整个过程很简单有效,不仅把发言人和内容对应上了,还去掉了口癖、纠正了错别字,输出成了阅读友好的Markdown格式。也不要本机运行 Whisper 这样的模型。

January 13, 2025

View Article

o1 不是一个聊天模型(这正是它的意义)[译]

我为什么会从厌恶 o1,到现在每天用它来解决最重要的问题?因为我学会了如何正确使用它。

January 13, 2025

View Article

让 AI 给你当学生,你自己当老师教 AI

看有人分享了个GPT用法:“看到一个用AI自学方法:网上找视频教程,用通义听悟转文字,结合其他基础资料喂给ChatGPT ,叫ChatGPT 开始给自己讲课。”我觉得这法子还不够好

January 13, 2025

View Article

问:写提示词的时候还需要角色设定吗?

问:写提示词的时候角色设定还需要吗? 如果想让大模型完成特定任务的时候

January 13, 2025

View Article

问:是模型在限制 tokens 长度还是应用在限制?

问:模型支持的TOKEN数量是模型本身的限制还是调用模型的程序限制的呢?

January 13, 2025

View Article

提示词不那么重要了吗?

问:宝玉老师,不知道我是不是没理解对,似乎之前微博中有提到提示词不那么重要了,怎么问产出结果不会相差太多。请问到底如何看待提示词工程呢,谢谢。

January 13, 2025

View Article

问:研发团队要怎么衡量ai coding带来的价值呢?

研发团队要怎么衡量ai coding带来的价值呢?

January 13, 2025

View Article

AI 创业者需要学习《苦涩的教训》[译]

* 在历史上,通用方法总能在 AI 领域取胜。 * 目前从事 AI 应用的创业者正在重蹈过去 AI 研究者的错误。 * 更好的 AI 模型将催生通用型 AI 应用,同时,围绕 AI 模型的“套壳软件”价值将逐渐降低。

January 12, 2025

View Article

AI编程革命:代码的未来,由AI重塑!

这周五在 X Space 上和 CSDN 的闫辉、以及 AutoCoder 的 William Zhu有过一次《AI编程革命:代码的未来,由AI重塑!》为主题的对话,我把文稿整理了一下。

January 12, 2025

View Article

在DevOps过程中,我们是否可以使用AI去把整个流程串起来?

在DevOps过程中,我们是否可以使用AI去把整个流程串起来?从理解业务需求,画原型图,根据原型出表结构,再根据表结构定义对象,代码实现需求,生成测试用例,进行自动化测试,出测试报告等?可以根据编排的任务去自动化实现上述过程。现在业界有这样的实现吗?

January 12, 2025

View Article

现在AI是否能做到记忆能力?

现在AI是否能做到记忆能力?比如我五天前给他设定了一个角色,并且请他解答了一些问题。那么五天后是否还能再次基于五天前的问答继续提问?(这可能是一个功能:设定角色,保存角色,基于这个角色的对话可以选择是否保存。这是不是需要有很长的token去支持?是否建议这样去做?)

January 12, 2025

View Article