首页


Prompt Engineering 的核心是逻辑

Prompt Engineering 的核心就是你怎么将一个复杂的任务拆成科学合理的步骤,并且让前面每一步的结果都成为后面步骤的基础,所有步骤合并在一起得到最终的结果,而不要指望一步得到结果。

March 20, 2024

View Article

如何让 GPT-4 生成更好的摘要

以 Lex 采访 Sam 的视频文稿的后面 45 分钟,分别让 GPT-4 和 Claude 3 总结,GPT-4 的要点总结的更好,生成结果更完整。

March 20, 2024

View Article

Sam Altman- OpenAI、GPT-5、Sora、Board Saga、Elon Musk、Ilya、Power & AGI | Lex Fridman 播客 [译]

本文是 Lex Fridman 播客的一期节选,主题是 OpenAI 的 CEO Sam Altman 与 Lex 的对话。Sam Altman 是 OpenAI 的 CEO,该公司是 GPT-4 的背后推手,ChatGPT, Sora, 也许有一天,会成为建立通用人工智能的那家公司。这是 Lex Friedman 播客。

March 19, 2024

View Article

小孩搭乐高和 AI 写程序

我家孩子沉迷搭乐高,陪他搭乐高的时候,我就联想起 AI 写程序!

March 18, 2024

View Article

软件开发的未来展望 [译]

当大语言模型 (LLMs) 能够创作出图像、文本和代码时,它们在创意领域引发了极大的关注。起初,这些创作令人啼笑皆非,比如画出手部奇怪的人物、产生错误的事实和代码的幻觉。然而,随着时间的推移,情况正在逐步且稳定地改善。在这些模型诞生之前,人们常常反对将这些任务自动化,认为机器无法进行创造性思维。但现在,这一论点正变得越来越站不住脚。那么,我们的下一步该往哪里走?

March 18, 2024

View Article

Nicolai 对微软 CEO Satya Nadella 的访谈 [译]

在这次独家采访中,我们有幸与微软 CEO Satya Nadella 进行对话。微软,作为全球市值最高的公司,其领导者的思维方式和对未来的见解无疑对我们所有人都有着重要的启示。Nadella 在采访中分享了他对科技行业未来、AI 的角色、以及个人成长和领导力的深刻见解。以下是这次富有启发性对话的整理稿。

March 17, 2024

View Article

创业指南 [译]

本指南特别适合初步了解初创企业领域的朋友们。对于那些已经阅读过 YC 合伙人大量著作的人来说,这里的内容可能并不陌生——我们的目标是把它们汇聚于此。

March 14, 2024

View Article

开发者们正面临前所未有的压力 [译]

目前,开发者们正经历双重的心理压力。一方面,持续不断的裁员让整个行业在较短时间内失去了更多的岗位,这种情况自二十多年前的互联网泡沫以来前所未有。那些曾经门庭若市的资深开发者现在却连一个回应都难以获得。而随着 Devin 的推出,AI 带来的威胁突然显得更加紧迫。

March 13, 2024

View Article

程序员是不是要被 AI 替代?

昨天 Devin 的大火,像一个 AI 程序员,能独立完成一些编程任务。这又引发了很多程序员是不是要被 AI 替代的讨论和焦虑。以至于很多人都在说:既然 AI 写代码能力越来越强了,还要不要学习 CS?要不要改行?

March 13, 2024

View Article

WhisperKit [译]

Whisper 项目已经让我们看到了一个不远的未来:快速、免费并且几乎没有错误的翻译和转录技术无处不在。这一进步激励了许多开发者在保证最大性能的同时,以最少的阻力改进并部署这一技术。

March 12, 2024

View Article

实验性的辅助“元”提示 [译]

Claude 2.1 在处理高达 20 万 Token 的庞大上下文时,检索特定句子的能力令人瞩目。我们通过实验发现,利用精心设计的提示技巧,可以引导 Claude 更准确地回忆出相关信息。

March 11, 2024

View Article

技术细节:简单说“不是高深莫测”(单调与 bors 的历程)[译]

我去年编写了一个程序,名字叫做 bors,现在来聊聊它以及它的一些前身的故事。这篇技术分享可能会让大多数人觉得乏味至极,但如果你的饭碗是靠编程挣的,那么我建议你不妨花一点时间看看。

March 9, 2024

View Article

聊天 GPT 与语气:如何避免发出机器人的声音 [译]

许多作家借助 ChatGPT 或其它 AI 聊天机器人来调整和优化他们的文风。然而,AI 在传递微妙的情感上仍显笨拙**。一些 AI 用户已经分享了几个小技巧,这些技巧可以帮助产生更优质的文本,并解决 AI 面临的问题。** 但实际效果如何呢?我进行的研究表明,利用已有的文本并请求多种回复,可以让输出更加自然。而使用特定的语气词则效果不明显。

March 9, 2024

View Article

微服务的“死亡千刃” [译]

软件行业正在重新领悟一个老教训:复杂性是致命的

March 8, 2024

View Article

人工智能应该开放吗? [译]

如果 OpenAI 想要通过牺牲人类免受恶意 AI 的安全,以获得更好的防止人们试图控制 AI 的安全,那么他们需要提出比我迄今为止看到的任何东西都更有力的理由,以证明后者的风险有多么严重。

March 7, 2024

View Article

谷歌的恐惧文化 [译]

深入谷歌 DEI 思维模式的内核,探究了 Gemini 失败的根源

March 7, 2024

View Article

OpenAI 和 Elon Musk [译]

我们一直致力于实现 OpenAI 的使命。OpenAI 的使命是确保全人类能从人工通用智能 (AGI) 中受益,这不仅意味着我们要构建既安全又有益的 AGI,也意味着我们要努力创造广泛分布的利益。现在,我们将分享我们如何实现这个使命的理解,以及我们与 Elon 的关系的一些事实。我们打算驳回 Elon 的所有主张。

March 6, 2024

View Article

“提示注入”与“破解”并不是一回事 [译]

我注意到很多人在讨论“破解”时误用了“提示注入”这个术语。这种误用已经变得如此普遍,以至于我怀疑我们是否还能纠正回来。语言的含义(特别是新近创造的术语)源于人们的使用习惯。尽管如此,我还是想尝试澄清这一点,因为我相信这两者之间的区别至关重要。

March 6, 2024

View Article

商业报道记者指南 [译]

本文揭示了我搜集到的关于 OpenAI 计划(经过调整)于 2027 年打造达到人类水平的通用人工智能(AGI)的信息。虽然不是所有的信息都容易证实,但希望足够的证据能够让你信服。

March 5, 2024

View Article

探索 Claude 的新纪元 [译]

在今天,我们兴奋地宣布 Claude 3 模型系列的问世,这一系列模型在多项认知任务上重设了行业的新高标准。这个家族包括了三款顶尖模型,它们按能力高低排列:Claude 3 Haiku、Claude 3 Sonnet 以及 Claude 3 Opus。每一款模型都在前者的基础上提升了性能,使得用户能够根据他们的具体需求,找到智能水平、响应速度和成本之间的完美平衡。

March 5, 2024

View Article

揭秘 OpenAI 至 2027 年打造通用人工智能的蓝图 [译]

本文揭示了我搜集到的关于 OpenAI 计划(经过调整)于 2027 年打造达到人类水平的通用人工智能(AGI)的信息。虽然不是所有的信息都容易证实,但希望足够的证据能够让你信服。

March 4, 2024

View Article

学习成为善用 AI 的人

《大模型应用开发极简入门:基于 GPT-4 和 ChatGPT》推荐序

March 1, 2024

View Article

Sora:探索大型视觉模型的前世今生、技术内核及未来趋势 [译]

Sora,一款由 OpenAI 在 2024 年 2 月推出的创新性文转视频生成式 AI 模型,能够依据文字说明,创作出既真实又富有想象力的场景视频,展现了其在模拟现实世界方面的巨大潜能。本文基于公开技术文档和逆向工程分析,全面审视了 Sora 背后的技术背景、应用场景、当前面临的挑战以及文转视频 AI 技术的未来发展方向。文章首先回顾了 Sora 的开发历程,探索了支撑这一“数字世界构建者”的关键技术。接着,我们详细探讨了 Sora 在电影制作、教育、市场营销等多个领域内的应用潜力及其可能带来的影响。文章还深入讨论了为实现 Sora 的广泛应用需克服的主要挑战,例如保证视频生成的安全性和公正性。最后,我们展望了 Sora 乃至整个视频生成模型技术未来的发展趋势,以及这些技术进步如何开创人机互动的新方式,进而提升视频创作的效率和创新性。图 1:Sora —— AI 视觉生成的重大突破。

February 29, 2024

View Article

为什么随着年龄增长,我们感觉时间似乎流逝得更快 [译]

36 岁的一年似乎比我小时候甚至十几岁的时候要短得多。这似乎是宇宙间的不公——我们的寿命更短了,而每一年过得也更快了。

February 27, 2024

View Article

谷歌 Deepmind 发布首个生成式交互环境模型 Genie [译]

我非常激动地分享 @Google DeepMind 开放创新团队的最新进展 🚀。我们推出了 Genie 🧞,这是一个从互联网视频中学习而来的创新世界模型,能够根据图像提示创造出无限种可操作的 2D 世界。

February 26, 2024

View Article

Gemini 与 Google 的文化观 [译]

Google,乃至更广泛的科技公司界,对于偏见的指控向来敏感,这种态度也延伸至图像生成领域。我理解这种在描绘假设场景时的谨慎态度。然而,很多图像反映的是真实历史。

February 26, 2024

View Article

现阶段 AI 的价值和盈利方向?

这个来源于之前我在聊 Sora 的时候,总结了 Sora 的价值和可能的盈利方向,我把这部分内容单独摘出来再整理一下。

February 24, 2024

View Article

给年轻人的副业建议

我给年轻人做副业的建议:重点不是你要不要做副业,而是你有没有设置长远的职业目标。不需要很长远,但三五年的目标是要有的。

February 24, 2024

View Article

Sora 将如何改变我们的生活?

Sora 将如何改变我们的生活?

February 22, 2024

View Article

V-JEPA:迈向 Yann LeCun 先进机器智能(AMI)愿景的新里程碑 [译]

我们人类对周遭世界的认知大多来源于观察——尤其是在生命的早期阶段。就拿牛顿的第三定律来说:甚至婴儿或是猫,在将物品从桌上推下观察其落下后,都能直观感受到“物体上抛必将下落”的道理。这种认知不需长时间的教导或阅读海量书籍就能获得。你的内部世界模型——基于对世界的心理构建的理解——帮你预测了这一切,并且极其高效。“V-JEPA 是让机器更实际理解世界、实现更广泛推理与规划能力的一大步。”Meta 的副总裁兼首席 AI 科学家 Yann LeCun 表示,他在 2022 年首次提出了 Joint Embedding Predictive Architectures(JEPA)概念。“我们旨在打造能够像人类一样学习、通过构建内部世界模型来适应和有效规划,以完成复杂任务的先进机器智能。”

February 22, 2024

View Article

Gemma:推出全新的顶尖开放模型 [译]

Gemma 承载着对负责任 AI 开发的承诺,它采用了与 Gemini 模型相同的研究成果和技术基础。

February 21, 2024

View Article

AI 像水一般普遍 [译]

水对我们而言,是生命之源、无所不在且看似毫无差异。AI,特别是生成式 AI 应用,亦复如此。

February 20, 2024

View Article

探索 Sora:视频制作的魔法 [译]

Sora 的视频质量似乎是不可能的,所以我深入研究了它的工作原理 它使用了扩散(从噪声开始,细化到期望的视频)和 Transformer 架构(处理连续的视频帧)。

February 20, 2024

View Article

新手如何为演讲制作精美的幻灯片 [译]

在多年的会议演讲经历中,我发现自己喜欢设计幻灯片,为每个话题创造新的视觉主题,这不仅令人兴奋,也成为了我投入准备演讲的动力。许多人询问我关于技巧和推荐工具,因此,在这篇指南中,我想分享一些我的经验心得,并介绍**三个简单步骤**,帮助你在接下来的会议季为你的演讲幻灯片增色添彩!

February 20, 2024

View Article

Sora 和之前 Runway 那些在架构上有啥区别呢?

简单来说 Runway 是基于扩散模型(Diffusion Model)的,而 Sora 是基于 Diffusion Transformer。

February 17, 2024

View Article

视频生成模型:构建虚拟世界的模拟器 [译]

我们致力于在视频数据上开展生成模型的大规模训练。具体来说,我们针对不同时长、分辨率和宽高比的视频及图像,联合训练了基于文本条件的扩散模型。我们采用了一种 Transformer 架构,这种架构能够处理视频和图像潜在编码的时空片段。我们的最大型号模型,Sora,能生成高质量的一分钟视频。我们的研究显示,扩展视频生成模型的规模是向着创建能够模拟物理世界的通用工具迈出的有前途的一步。

February 16, 2024

View Article

Sora 的工作原理(及其意义) [译]

OpenAI 的新型文本到视频模型为电影制作开启了新篇章

February 16, 2024

View Article

大语言模型提示工程综述:技巧与应用领域 [译]

在扩展大语言模型 (LLM) 及视觉 - 语言模型 (VLM) 能力方面,提示工程已成为关键技术。它通过特定任务的指令,即提示,提升模型效能,无需更改模型核心参数。这些提示能够通过给定的指令直接引导预训练模型完成下游任务,从而实现模型行为的精确调控。这些提示既可以是指导模型的自然语言说明,也可以是激发相关知识的向量表示。提示工程作为一个新兴领域,在多种场景下展现了其强大的应用潜力,包括问答系统、常识推理等。尽管如此,这一领域的方法和技术仍缺乏系统性的整理和理解。本文通过系统性概述提示工程的最新进展,并按应用领域进行分类,旨在填补这一空白。我们对每种提示方法进行了详细总结,包括其方法论、应用案例、相关模型及数据集。同时,我们探讨了各方法的优缺点,并提供了一个包含数据集、模型及关键技术点的分类图和表格。通过这一系统性分析,我们能够更深入地理解这个快速发展的领域,并指出未来研究的方向和挑战。

February 15, 2024

View Article

AI 或许真的能助力中产阶级重塑辉煌 [译]

人工智能(AI)并不一定会夺走我们的工作。相反,它为我们提供了一个机遇,那就是将专业知识推广至更广泛的劳动者群体。

February 15, 2024

View Article

直截了当:展示给我提示符。 [译]

通过截获 API 调用,迅速掌握难以解读的大语言模型框架。

February 15, 2024

View Article

“提示工程师”:一个即将过时的职业 [译]

关于未来职业的讨论已经铺天盖地,我也曾深入探讨过从机器人管家到气候难民等多个领域。而在 AI 创造的众多工作中,最近一年多来,“提示工程师”这一职业引起了广泛关注。

February 14, 2024

View Article

如何使用 ChatGPT Api 和 Node.js 对 Youtube 视频内容进行摘要 [译]

本期,我将介绍一个教程,告诉你如何利用 Node.js 构建一个系统,该系统能够通过 Youtube 视频链接,利用 OpenAI 提供的 completions api(也就是 ChatGPT 所基于的 API)来生成视频内容的摘要。

February 14, 2024

View Article

OpenAI 的最终挑战 [译]

关于《纽约时报》与 OpenAI 版权诉讼结果的思考

February 13, 2024

View Article

关键人才是发展的瓶颈 [译]

“这家公司缺乏焦点”这句话让我感到困惑。公司不是应该通过增加员工来扩大其业务范围,进而提高专注度吗?事实上,这是有道理的:例如,谷歌有超过 100 个产品,远超任何初创公司的产品数量。但从另一个角度看,鉴于谷歌拥有约 20 万员工,100 个产品似乎又显得不足。以 Instagram 为例,它最初只有不到 13 名员工就成功推出了产品。按照这个效率,谷歌理论上应该能推出更多的产品。那么,是什么导致了这种差异?大型科技公司为什么不能推出更多的产品呢?

February 12, 2024

View Article

在使用 Vision Pro 40 小时后的感悟 [译]

我正坐在夏威夷一座 10,000 英尺的高山之巅,面前是一块 30 英尺的巨屏,同时也在奥斯汀一家咖啡馆里的桌旁。我敢说,周围的人肯定在偷拍我,然后把照片发给朋友,让他们一起笑我是个怪人。最近这一周,我的生活变得不可思议。我的奇幻之旅始于 30 年前的 1990 年,那时候我的父母带我去波士顿的海港世界贸易中心参观一场名为“虚拟现实展”的活动。我站在一个小圆台上,工作人员给了我一个塑料枪,又戴上了一个笨重的头盔。瞬间,我仿佛穿越到了一个卡通世界,穿着军装,手里拿着真枪。台旁的另一个人也以卡通形象出现,同样手持枪械。在一阵笨拙的挥舞和射击后,我被工作人员请出,为下一个人让出位置。

February 12, 2024

View Article

如何作为软件工程师涉足机器人技术 [译]

我一直在网站服务和移动应用开发领域工作,但这最终变得有些单调。回想起高中时代,我曾是焊接俱乐部的一员,那时起我就有种想挑战更高难度问题的渴望。两年前,我开始在阿姆斯特丹寻觅机遇,最终加入了 Monumental。如今,我在这里致力于利用机器人技术自动化建筑施工,首先从砖石工作开始。当系统顺利运行,亲眼见证一堵墙慢慢建成时,那份成就感是难以言喻的。相比之下,看到别人忙于加密货币或金融科技的项目时,我总感觉如果我去做那些事情,肯定会感到极度无聊。

February 12, 2024

View Article

为什么软件工程师喜欢木工 [译]

事实证明,木工的精髓与软件工程并无太大差异:在软件工程中最美妙的时刻莫过于构建你自己的工具,这是一种充满目的的工作。

February 12, 2024

View Article

谷歌工程师:AI 对我们的业务构成严重风险 [译]

谷歌通过分析用户与搜索结果页面的互动数据——例如点击某个结果、返回再点击其他结果——来优化其搜索结果的排名。多年来,这种方法帮助谷歌在搜索相关性上保持领先,因为相比其他搜索引擎,谷歌拥有更丰富的用户互动数据。但在 2018 年末,谷歌工程师们意识到,随着语言模型的发展,它们最终能够仅凭网页的文本内容,而无需任何用户反馈,就理解网页的含义。这一发现表明,即使是一个小型的创业公司也有可能挑战谷歌在搜索领域 20 年的领先优势。谷歌资深软件工程师 Eric Lehman 在观察到谷歌的 BERT 语言模型在处理搜索结果页面上的“网页答案”时取得的初步成果后,写了一封电子邮件,警告 AI 技术可能对公司构成重大威胁。

February 12, 2024

View Article

成为众人喜爱的聊天达人 [译]

我们真的有学过如何进行良好的交谈吗?事实上,并没有。似乎人们总期望我们能自然地学会这门技艺...难怪很多人的沟通技巧并不尽如人意。如何才能成为那种人们乐于交谈的人呢?为了回答这个问题,我整理了大量的研究和专家访谈,让我们一起把这些知识转化为实际可行的技巧。

February 11, 2024

View Article

Tutor Me Prompt

Prompt of "Tutor Me" GPT

February 7, 2024

View Article