翻译

翻译的一些我觉得不错的科技文章。


在大语言模型时代如何改进推荐系统与搜索

以下将讨论过去一年左右工业界在搜索和推荐领域的演进,重点涉及模型架构、数据生成、训练范式以及统一框架

March 24, 2025

View Article

我认识的最差程序员

衡量开发者生产力最棒的一点是,你能快速识别出差劲的程序员。今天我要和你讲讲我所认识的最差程序员,以及为什么我拼了命也要把他留在团队中。

March 24, 2025

View Article

苦涩的教训:重新思考如何构建AI系

我以前也认为,搭建优秀的AI系统靠的是巧妙的设计和复杂的规则。这就是典型的软件工程师思维:建立系统,考虑边界情况,加以处理,便万无一失。但现在看来,我当初真是大错特错了。

March 24, 2025

View Article

如果你感觉 2025 年职场不好混了,并不是错觉

通过这篇文章,读者可以从一位资深技术领导者的视角,深入理解当前科技行业的变化趋势,并获得应对职业挑战的实用建议。

March 18, 2025

View Article

为什么大部分公司根本不应该制定所谓的「AI 战略」?

企业领导们害怕落后,纷纷冲向AI,但他们真的做对了吗?这位专家却不这么认为。

March 16, 2025

View Article

致敬“普通”的工程师——一位软件工程师对“10倍工程师”神话的质疑与反思

一名软件工程师对所谓的“10倍工程师”神话提出质疑

March 14, 2025

View Article

数学与AI之间的文化鸿沟

今年1月,我参加了主题为“我们决定自己的未来:AI时代的数学”的联合数学大会(简称JMM)。这场大会像是一场数学界的盛宴,各种演讲让我应接不暇。我不仅参加了自己熟悉的领域(比如模形式),也去探索了一些新鲜的领域(比如知识图谱),还关注了许多关于AI如何帮助数学研究的讲座。

March 14, 2025

View Article

真正的AI智能体即将到来:告别死板提示词,迎接自主规划时代!

目前,只有少数几家大公司有能力开发出真正的LLM智能体。虽然短期内这样的技术可能仍集中在巨头手里,但长远来看,这种局面必须被打破。

March 13, 2025

View Article

从互联网泡沫破裂,看今天 AI 热潮的未来

**曾经被炒作的互联网技术,最终真的改变了世界。**

March 11, 2025

View Article

Apple AI 的平台转型潜力

这事之所以让人震惊,是因为苹果这家素以保密著称的公司,居然会在功能尚未成熟时就大举做广告。而且,当时我(原作者 Ben Thompson)也在某种程度上赞成这波操作。

March 11, 2025

View Article

50位 a16z 合伙人对 2025 年科技领域发展趋势的预测

外部“AI大脑”、生物医药大动作、无限游戏、核能回潮、“无脸”创作者、挑战谷歌搜索、战场AI……

March 11, 2025

View Article

什么是模型上下文协议(MCP)?它如何比传统API更简单地集成AI?

你可以把MCP想象成AI领域的“USB-C接口”,它能让不同的AI模型与外部工具和数据源轻松连接。

March 9, 2025

View Article

论文:《自动化的反讽》(Ironies of Automation)[译]

任何自动化系统最终都会变成“人与机器共同协作的系统”。哪怕你不断提高自动化的水平,“人的因素”始终至关重要。

March 7, 2025

View Article

纽约时报观点 | 美国政府认为 A.G.I. 即将到来

拜登政府的人工智能顾问本·布坎南(Ben Buchanan)讨论了美国政府如何为通用人工智能做准备——以及仍然面临的所有挑战。

March 5, 2025

View Article

模型即产品(The Model is the Product)

过去几年,人们一直在讨论下一个AI发展周期可能是什么:智能体(Agents)?推理系统(Reasoners)?还是彻底的多模态? 现在是时候下结论了:下一个周期,就是“模型本身即产品”。

March 4, 2025

View Article

《人工智能君主制》(The A.I. Monarchy)

关于加速主义、NRx,以及技术、宗教与哲学交汇之下的美国新政治核心思想分析

March 3, 2025

View Article

AI 作为引擎,人类作为方向盘

本文的目标是探讨一种新的范式:或许可以利用 AI 来保留民主结构的好处,同时避免它的弊端。即“AI 作为引擎,人类作为方向盘”。在人类这边,只需向系统提供少量但高质量的信息,也许只需几百比特;而由 AI 将这些数据视为“目标函数”,通过大规模决策来尽最大努力满足这些目标。尤其值得探讨的是:能否在不将某个_单一_ AI 固化在中心的情况下做到这一点,而是依赖一个任何 AI(或人类与 AI 的混合体)都可以参与竞争的开放市场?

March 1, 2025

View Article

DeepSeek 开源周第 6 天彩蛋 – DeepSeek-V3/R1 推理系统概览

通过以下方式优化吞吐量和时延: 基于跨节点 EP 的批量扩展\ 计算与通信重叠\ 负载均衡 DeepSeek 在线服务统计数据:\ 每个 H800 节点每秒输入/输出分别达 73.7k/14.8k token\ 成本利润率 545%

March 1, 2025

View Article

AI 正在“扼杀”某些公司,却也让另一些公司蓬勃发展 ——让我们一起看看数据

来自 WebMD、Quora、Stack Overflow、Chegg、G2、CNET、Reddit、Wikipedia 和 Substack 的流量趋势

February 28, 2025

View Article

如何像人类一样进行代码评审(第二部分)

这是我关于如何在代码评审中进行有效沟通并避免陷阱的文章下半部分。在这里,我将重点放在如何在避免不愉快冲突的前提下,让代码评审顺利结束。

February 28, 2025

View Article

如何像一个人一样做代码审查(第一部分)

最近,我阅读了一些关于代码审查最佳实践的文章。我发现这些文章把重点几乎全部放在了“找漏洞”上,而几乎忽视了审查工作的其他方面。发现问题后如何以建设性和专业的方式进行沟通?对不起,这一部分似乎完全不重要!只要发现所有的漏洞,剩下的事情自然就会迎刃而解。

February 28, 2025

View Article

在 AI 时代,博客写作仍然值得 【译】

去年,当我重新开始半定期写博客时,也问过自己同样的问题,这篇文章正是我试图总结为何博客写作依然值得的原因。简单来说就是:写博客不只是为了被人阅读,而是为了学习与思考,同时留下你曾经思考和学习的持久证据。

February 28, 2025

View Article

OpenAI GPT-4.5 系统卡

我们现正发布一个研究预览版的 OpenAI GPT-4.5,这是我们迄今规模最大、知识最丰富的模型。在 GPT-4o 的基础上,GPT-4.5 进一步扩大了预训练规模,并旨在比我们强大的以 STEM(科学、技术、工程和数学)为中心的推理模型具有更通用的用途。我们在训练中结合了新的监督技术以及传统方法,如有监督微调(SFT)和来自人类反馈的强化学习(RLHF),与 GPT-4o 使用的方法类似。我们在部署前进行了广泛的安全评估,并未发现与现有模型相比有任何显著增加的安全风险。

February 27, 2025

View Article

人工智能生成的代码如何加剧技术债务

在我 35 年的技术生涯中,我从未见过在如此短的时间里产生如此多的技术债务

February 27, 2025

View Article

作者 Mark Manson 对自己的畅销书《The Subtle Art of Not Giving a F*ck》的总结

大家好,我是**马克·曼森(Mark Manson)**,\ 我写过一本纽约时报畅销书,叫做《**The Subtle Art of Not Giving a Fuck**》(通常被译为《不烦恼的艺术》或《活出自己不在乎的力量》等)。

February 27, 2025

View Article

介绍 GitHub Copilot agent 模式(预览版)

Copilot agent 模式是 AI 辅助编程的下一步演化。它可以作为一位自治的“编程同伴”,执行多步骤的编码任务——分析你的代码库、阅读相关文件、提出文件修改建议、执行终端命令并运行测试。它能够对编译和 lint 错误作出响应,监控终端和测试输出,并在循环中自动修复,直到任务完成。

February 25, 2025

View Article

Deep Research 的问题 【译】

OpenAI 的 Deep Research 看起来像是专门为我打造的工具,但我却无法真正使用它。它再次展现了惊艳的演示效果,直到它崩溃——而且崩溃得十分有趣。

February 25, 2025

View Article

Deep Research 系统卡(中文)

本报告概述了在发布深度研究之前所开展的安全工作,包括外部红队测试、根据我们的准备框架进行的前沿风险评估,以及针对关键风险领域所制定的缓解措施。

February 25, 2025

View Article

LLM(机器学习)职位面试(2024年秋季)——流程回顾 [译]

这是作者在 2024 年秋季面试以 ML/LLM 研究科学家/工程师为主要方向的职位时的经历分享。

February 25, 2025

View Article

Claude 的推理思考(Extended Thinking)【译】

有些事情,我们几乎瞬间就会想到答案,比如“今天是星期几?”。但也有一些事情需要更大的脑力投入,例如解一道有难度的填字谜题或排查一段复杂的代码错误。我们可以根据手头的任务,自由选择要投入多大程度的认知努力。

February 25, 2025

View Article

Claude 3.7 Sonnet 和 Claude Code 【译】

Claude 3.7 Sonnet 在编程和前端网页开发方面表现尤为突出。伴随这个新模型,我们还推出了一个用于代理式编程的命令行工具——Claude Code。目前 Claude Code 作为一款有限的研究预览版本向开发者开放,允许他们从终端直接将大量工程任务委派给 Claude。

February 25, 2025

View Article

请求“不”,而非请求“是”

我认为保持行动的偏好非常重要。就像其他习惯一样,这可以通过练习养成。向前迈进能让你取得进展。我不知道你是否也有过这样的经历:曾经因为不知道该选择哪条路而感到停滞不前。哪怕只是迈出最小的一步,也能帮助你打破这种僵局。

February 24, 2025

View Article

你无法用 AI 建立护城河 [译]

使用 LLM 已经不足以让你的产品与众不同

February 21, 2025

View Article

软件工程职位数量真的跌到了五年来的最低点吗?[译]

招聘网站 Indeed(在美国和部分其他国家都是规模最大的职位聚合平台,也会抓取其他网站的招聘信息)发布了一组有趣的数据,展示了网站上“活跃的软件开发类职位”数量的变化趋势。总的来看,形势并不算好

February 21, 2025

View Article

LangChain 团队发布 LangMem SDK

今天LangChain发布了 LangMem SDK,这是一个可帮助你的代理通过长期记忆进行学习和改进的库。它提供了从对话中提取信息、通过提示更新来优化代理行为,以及维护关于行为、事实和事件的长期记忆的工具。

February 18, 2025

View Article

刚入门的初级开发者其实并不真的会写代码 [译]

我们正处在软件开发的一个奇怪转折点。每个我接触到的初级开发者都有 Copilot、Claude 或 GPT 这类工具在 24 小时全天候运转。他们交付代码的速度比以往任何时候都要快。但是,当我更深入地了解他们提交的代码背后的原理时?问题就出现了。

February 18, 2025

View Article

找到心流:通过深度工作和慢生活逃离数字干扰 [译]

一份在无尽诱惑时代中重拾专注的个人指南

February 18, 2025

View Article

OpenAI 的 Deep Research 会让我失业吗?

数以百万计的人面临失业,居然只用一条推文就随意宣布了……但这就是我们当下所处的时代。

February 17, 2025

View Article

我们对于 GPU 的看法错了 [译]

> *我们选择了人迹罕至的道路,但后来才发现它之所以罕至,是有原因的。*

February 17, 2025

View Article

Cursor: 以每秒 1000 个 Token 的速度编辑文件

一种新的模型和推理方法,可在 1000 tokens/s 的速率下对整个文件进行高精度编辑。

February 16, 2025

View Article

NASA 的软件开发十条规则

这些规则是从编写“昂贵航天器上的嵌入式软件”这一角度制定的。在这种场景下,为了保证不让一个任务功败垂成,选择“容忍大量编程痛点”通常是值得的。我并不清楚,为什么他们不使用为程序验证而生、并且比 C 更适合嵌入式编程的 SPARK(Ada 的子集)。\ 这里我会从“编写编程语言处理器(编译器、解释器、编辑器)以及应用软件”的角度来对这些规则进行批判性评述。

February 16, 2025

View Article

什么是 AI 架构师? — Bret Taylor

以下内容整理自播客“Latent Space”最近的一期“The AI Architect — Bret Taylor”,邀请到了嘉宾是 Bret Taylor,是一位拥有传奇经历的 Sierra CEO、OpenAI 主席,以及 Google Maps / Facebook Likes 的缔造者,在节目中分享了他对软件工程未来的见解,以及在 AGI 曙光降临之际,如何打造优秀的产品和团队。内容比较长,但是值得认真看看,我对于一些有价值的内容已加粗,如果时间有限,也可以挑重点看看。

February 16, 2025

View Article

推理模型使用最佳实践

了解何时使用推理模型,以及它们与 GPT 模型有何不同。

February 14, 2025

View Article

人工智能如何区分“头部人才”和“普通员工” [译]

**乐观主义者曾希望人工智能这项技术能成为强大的均衡器,但它似乎更可能扩大社会差距**

February 14, 2025

View Article

Deep Research 与知识价值:从信息搜索到价值重新定义

知名博主 Ben Thompson 在使用 Deep Research 后写的一篇 Deep Research and Knowledge Value,谈到了在信息搜索上带来的价值。Deep Research 极大的降低了信息整合的成本,以前要专门人去整理的工作,现在借助 Deep Research 十分钟左右就可以完成,但是它也很依赖于公开的信息,而且热门话题往往噪音多、信噪比差;小众/专业话题数据更集中且高质,价值更明显。但对于小众信息来说,如果真正关键或独家数据并未对外公开,那么再强大的 AI 也无法查询到,最终会导致报告中出现“严重缺失”,反而并给人造成“似乎已经知道一切”的假象。

February 13, 2025

View Article

OpenAI 论文:使用大型推理模型进行竞技编程

我们发现,将强化学习应用于大型语言模型(LLM)能够显著提升在复杂编程和推理任务上的表现。此外,我们比较了两种通用的推理模型——OpenAI 的 o1 和一个早期版本的 o3——与一种面向特定领域的系统 o1-ioi。o1-ioi 采用了人工设计的推理策略,旨在参加 2024 年国际信息学奥林匹克竞赛(IOI)。我们使用 o1-ioi 在 IOI 2024 的现场比赛中参赛,并结合手动调试的测试时策略,获得了第 49 百分位的成绩;在放宽比赛限制后,o1-ioi 达到了金牌水平。然而,当我们评估后续版本如 o3 时发现,o3 在无需人工编写的特定领域策略或放宽限制的情况下,也能获得金牌。我们的研究表明,尽管 o1-ioi 这类专门管线能带来显著性能增益,但规模更大的通用模型 o3 无需依赖人工设计的推理启发式即可超越这些结果。值得注意的是,o3 在 2024 IOI 上取得了金牌,并在 CodeForces 上的水平可与顶尖人类选手媲美。整体而言,这些结果说明,与其依赖特定领域的技巧,不如通过扩大通用强化学习规模的方式,为在需要推理能力的领域(如竞技编程)实现最先进的 AI 提供了更稳健的路径。

February 13, 2025

View Article

Anthropic 经济指数

知名 AI 公司 Anthropic 刚发布了 **Anthropic 经济指数(Anthropic Economic Index)**,他们通过分析了几百万条匿名的用户在 Claude 上的聊天记录,分析了日常对话中 AI 的使用模式:从软件开发和技术写作等高频应用场景,到薪资与职业类型之间的关联,再到 AI 在“增强”与“自动化”两大方向上的分布,得出了一些有价值的分析结果。

February 10, 2025

View Article

都没人看我为什么还要写博客?

我也曾纠结于写的东西无人观看,后来发现,就像照相一样,不是为了别人而是为了自己,按下快门捕捉到美好的瞬间,完成自己的思考和创作。再后来践行费曼学习法,发现写作才是“费曼学习法”的最佳操作方式。

February 10, 2025

View Article

什么是多模态大语言模型(MLLM)?[译]

本文将介绍多模态大语言模型(MLLMs),展示它们在各种高难度提示(prompt)下的应用,并介绍目前正在重塑计算机视觉领域的顶尖模型。

February 10, 2025

View Article

处理数百万份 PDF,以及为何 Gemini 2.0 能改变一切 [译]

在任何 RAG 系统中,将 PDF 进行分块(将其转换为简洁且机器可读的文本片段)一直是个头疼的问题。市面上既有开源也有专有的解决方案,但它们都没有在准确性、可扩展性和成本效益之间达到理想的平衡。

February 8, 2025

View Article