首页

什么时候该用多智能体是不是一定要用多智能体？

以翻译为例，讨论什么时候该用多智能体是不是一定要用多智能体。

June 26, 2024

当 AI 能考上一本，十年寒窗苦读还有意义吗？

家里有亲戚朋友参加高考的话，就知道上个一本线也没有那么容易，如果我第一次参加高考的时候看到这新闻，估计要怀疑人生了。十年寒窗苦读，最后还不如一个 AI 的成绩，学习还有意义吗？

June 25, 2024

升级到 GPT-4o 后使用提示词的五项调整 [译]"

ChatGPT 比以前更好用了，但我发现要想最大限度地利用它，您必须对现在的提示方式与使用 GPT-3.5 时的提示方式进行 5 项调整。我们将介绍 GPT-4o 的新功能，以及您的提示需要如何更新。

June 24, 2024

蔡崇信谈为什么阿里巴巴全力投入 AI [译]

这是今年五月蔡崇信在 2024 年摩根大通全球中国峰会期间炉边会谈的视频。在与关金星的 30 分钟对话中，蔡崇信概述了人工智能如何推动他 25 年前共同创立的公司在核心电商业务或云部门的增长。

June 23, 2024

HeyGen CEO 徐卓（Joshua Xu）访谈 [译]

AI 视频生成模型在制作引人入胜和复杂视频方面还有很长的路要走，但 HeyGen 团队正在通过使用语言、视频和语音模型来简化视频制作过程，从而创建包含个性化头像、插图（b-roll）和对话的视频。本周在“No Priors”节目中，HeyGen 的联合创始人兼 CEO Joshua Xu 加入了 Sarah 和 Elad 的讨论，介绍 HeyGen 团队如何分解视频的各个元素，并为每个元素构建或找到相应的模型，这些 AI 视频的商业应用，以及他们如何防范深度伪造（deep fakes）。

June 23, 2024

AI 是功能还是产品？ [译]

The new Siri vs the RabbitR1 and Humane pin

June 22, 2024

优化 Character.AI 的 AI 推理 [译]

在 Character.AI，我们正朝着通用人工智能 (AGI) 的目标迈进。在未来，大语言模型 (LLMs) 将会增强我们的日常生活，不仅提高商业生产力和娱乐效果，还能在教育、教练、支持、头脑风暴、创意写作等方面提供帮助。要在全球实现这一愿景，关键在于实现高效的“推理”，即 LLM 生成回复的过程。作为一家全栈 AI 公司，Character.AI 从头开始设计其模型架构、推理架构和产品，创造了独特的机会来优化推理，使其更高效、更具成本效益，并能扩展以满足快速增长的全球用户需求。

June 21, 2024

在对 500 万个自由职业工作的分析后发现这些工作岗位最可能被 AI 替代 [译]

毫无疑问，人工智能 (AI) 将对工作产生影响。但是，哪些工作更有可能被 AI 替代？哪些工作现在已经在被 AI 替代？为了找到答案，我决定查看实实在在的数据：从 2022 年 11 月 1 日（ChatGPT 发布前一个月）到 2024 年 2 月 14 日，Upwork 上的实际自由职业工作数据，看看哪些工作受到了最大的负面影响。

June 21, 2024

人工智能无处不在：改变世界，赋予人类力量 [译]

达特茅斯工程学院与校友、OpenAI 首席技术官 Mira Murati Th'12 举行了一场独家对话。她讨论了 ChatGPT 和 DALL·E 背后的人工智能（AI），以及正在进行的安全和伦理考量及未来的影响。

June 21, 2024

黃仁勳旋風席捲台灣方念華獨家專訪！

黃仁勳旋風席捲台灣方念華獨家專訪！Exclusive Interview with NVIDIA CEO Jensen Huang 20240616 (完整版)

June 19, 2024

发现提示工程——提示工程就是为了从生成式 AI 中获取有用输出而设计有效提示词的过程 [译]

我叫 Yufeng，我在 Google 担任工程师。我对设计提示词感兴趣的最初动机是因为从语言模型中获取有用的回应需要花费大量时间。有时候，我们甚至在不使用 AI 的情况下也能更快地完成工作。我希望能使我们的工具更加高效，而不是效率更低。我很高兴能帮助你更深入地了解如何设计有效的提示词。

June 19, 2024

Prompt 高级技巧：借助伪代码精准的控制 LLM 的输出结果和定义其执行逻辑

当你需要更精准的控制 LLM 的输出结果和定义其执行逻辑时，该怎么做？

June 15, 2024

小技巧：GPT 多了怎么管理？

使用 ChatGPT 的 @ 功能，可以快速找到你用过的 GPT，或者根据关键字检索到，然后再输入你要它完成的任务，和你单独打开 GPT 输入效果是一样的。

June 14, 2024

计算机专业还值得报考吗？

从我二十多年前参加高考以来，每年高考一结束，#计算机专业还值得报考吗# 就一直热门话题，一些人认为计算机发展了这么多年已经饱和，可能面临毕业即失业的风险，而另一些人则认为计算机专业依然是未来的热门专业，就业前景广阔。

June 13, 2024

AI 民科和 AI 科学家之间的差距

从一段翻译 Prompt 说起。

June 13, 2024

苹果新推出的设备内及云端服务器基础模型介绍 [译]

在 2024 年全球开发者大会上，我们向大家展示了苹果智能系统，这是一套深度融入 iOS 18、iPadOS 18 及 macOS Sequoia 的个人智能体系。这一系统集成了多个功能强大的生成式 AI，专为处理用户日常需求而设计，能够根据用户当前的活动实时调整。苹果智能中的基础模型经过专门微调，以优化各种用户体验，如文本编写、通知的排序与摘要、为家庭及朋友对话创造有趣的图像，以及简化应用间的交互操作。

June 11, 2024

探索检索和评估相关上下文的挑战 [译]

利用 Ragas, TruLens 和 DeepEval 对一年级阅读理解练习进行上下文相关性评估的案例研究

June 11, 2024

最佳论文 [译]

虽然这篇文章的标题称其为“最佳论文”，但实际上并非如此。我的目标是探索一篇真正的最佳论文应具备的特质。

June 11, 2024

使用大语言模型 (LLMs) 构建产品一年后的经验总结 [译]

现在是使用大语言模型 (LLMs) 构建产品的激动人心的时刻。在过去的一年中，LLMs 的表现已经“足够好”可以应用于现实世界。LLMs 改进的速度，加上社交媒体上的大量演示，将推动预计到 2025 年 AI 投资达到 2000 亿美元。LLMs 的广泛可用性，让每个人，而不仅仅是机器学习工程师和科学家，都能在他们的产品中构建智能。虽然构建 AI 产品的门槛已经降低，但要创建那些不仅仅是演示效果好的产品，仍然充满挑战。

June 9, 2024

测试 Chrome 内置 Gemini Nano 大语言模型 (4bit 3.25B) 的方法

如何测试 Chrome 内置的 Gemini Nano 大语言模型

June 8, 2024

问答：有校对好的视频文稿如何用文稿纠正字幕错误？

我有校对好的视频文稿，但是 Whisper 生成的字幕有错误，我该如何用文稿纠正字幕错误？

June 7, 2024

问答：如何使用 GPT 知道我写 R 代码？

我用文字描述的方式请教 copilot 指导我写 R 代码（科研作图用），但效果不好。与此同时我查到一现成的完美代码，但因为看不懂，无法根据实际情况调整，所以也无法复现。这个时候我想让 copilot 帮我协调一下，即用现成的代码基础上根据我的说明进行调整，promote 我应该一次性说清楚，还是分多次？

June 7, 2024

什么是提示词注入攻击？ [译]

我们将介绍提示词注入的工作原理、常见类型以及潜在的风险和后果。你将了解提示词注入如何使得系统生成错误信息、编写恶意软件，甚至可能导致数据泄露和系统远程接管。视频还会探讨应对提示词注入的多种方法，包括数据审查、最小权限原则、人类反馈强化学习等。

June 5, 2024

NVIDIA 公布了到 2027 年的 GPU 和互连路线图 [译]

在计算、网络和图形的发展历史上，Nvidia 有许多独特之处。此刻，它拥有大量资金，并且凭借其架构、工程和供应链在生成式 AI (generative AI) 市场中占据了领先地位，使其能够随心所欲地制定任何可能带来进展的路线图。

June 4, 2024

使用大语言模型 (LLMs) 构建产品一年后的经验总结 (第二部分)[译]

运营大语言模型应用程序提出了一些在运营传统软件系统时熟悉的问题，但通常有新的变化来保持新鲜感。大语言模型应用程序还提出了全新的问题。我们将这些问题及其答案分为四部分：数据、模型、产品和团队。

June 4, 2024

为什么对于有的人来说 ChatGPT 并没有什么卵用？

看到微博上一位医生这条被 ChatGPT-4o 坑的微博，尝试从技术角度解读一下，这样也许能更好的理解现阶段大语言模型的优缺点，在实际应用中能扬长避短。

June 2, 2024

使用大语言模型 (LLMs) 构建产品一年后的经验总结 (第一部分) [译]

May 30, 2024

谷歌搜索秘籍泄漏：揭秘内部工程文档 [译]

探索你一直渴望了解的谷歌算法的秘密。

May 29, 2024

数千份谷歌搜索 API 的泄露文件曝光，SEO 从业者必看 [译]

2024 年 5 月 5 日，我收到一封电子邮件，发件人称得到谷歌搜索部门大量泄漏的 API 文档集的访问权限。邮件还提到，这些泄露文件已经得到前谷歌员工的验证，证实其真实性，并且这些前员工及其他人还透露了更多关于谷歌搜索操作的秘密信息。

May 28, 2024

映射大语言模型的思维 [译]

今天，我们在理解 AI 模型内部机制方面取得了重大突破。我们已经识别出数百万个概念在 Claude Sonnet（一种我们部署的大语言模型）中的表示方式。这是首次对现代生产级大语言模型的内部进行详细研究。这一发现有助于未来提升 AI 模型的安全性。

May 21, 2024

使用 NSFW 聊天机器人模拟人类 - 与 Jesse Silver 对话 [译]

利用开源的大语言模型 (LLM) 和 DSPy 技术来缓解提示注入问题，我们开发了迄今为止最先进的 AI 电子商务聊天机器人，使 OnlyFans 网红的收入提高了 2-5 倍。

May 18, 2024

你好 GPT-4o [译]

GPT-4o（“o”代表“omni 全方位”）能够实时处理音频、视觉和文本信息，使人机交互更加自然流畅。这款模型支持多种输入（文本、音频、图像）和输出（文本、音频、图像）模式，其响应音频的速度极快，最快可达 232 毫秒，平均响应时间为 320 毫秒，与人类在对话中的反应速度相当。无论是处理英语文本还是代码，GPT-4o 的表现堪比 GPT-4 Turbo，而在处理非英语文本方面则有了显著提升，同时运行速度更快，API 成本也减少了 50%。特别是在视觉和音频理解方面，GPT-4o 表现远超以往模型。

May 14, 2024

AlphaFold 3 揭示生命分子的秘密结构及其相互作用 - Isomorphic 实验室 [译]

Isomorphic 实验室和谷歌 DeepMind 共同开发的最新 AI 模型 AlphaFold 3，能够准确预测蛋白质、DNA、RNA 及配体等生命分子的结构及其相互作用，我们期待这一成果将深刻变革我们对生物世界与药物开发的理解。

May 8, 2024

ChatGPT 提示词十级技巧：从新手到专家 [译]

欢迎加入我们，深入探讨从基础到高级的 10 级 ChatGPT 提示工程技术。从基本的提示格式入手，逐步学习使用角色化技术，再进一步掌握如思维链 (Chain of Thought, CoT) 等更复杂的技术。在目前的工作中，我努力最大限度地提高从 GPT-4 及其他大语言模型 (Large Language Models, LLMs) 获取的准确性和实用性。我已经投入了数十小时研究学术论文和数百小时的模型提示实践，这个视频是我将这些经验压缩成 9 分钟分享的尝试。希望这个视频能为你带来启发。如果你有任何疑问，欢迎在评论区留言，我会确保回答你的问题！

May 6, 2024

我如何夺冠新加坡首届 GPT-4 提示工程大赛 [译]

深度探索我在驾驭大语言模型（LLMs）中学到的策略

May 6, 2024

Sam Altman 在斯坦福创业者思维领导研讨会上的对话 [译]

Sam Altman 在与斯坦福大学兼职讲师拉维 - 贝拉尼（Ravi Belani）的对话中，阿尔特曼为有抱负的人工智能创业者提供了建议，并分享了他对人工智能工具和人工通用智能的机遇与风险的见解。

May 3, 2024

提示工程的基本理念以及如何将这些理念应用于提升大语言模型的性能 [译]

大语言模型的接口：大语言模型广受欢迎的一个重要原因在于，其文本到文本的接口极其简单，用户可以轻松使用。在早期，使用深度学习解决一个任务通常需要对模型进行微调，通过数据训练使其掌握解决该任务的方法。而且，这些模型大都只专注于单一任务。但是，大语言模型具备了通过文本提示解决多种问题的能力，这种在上下文中的学习能力使得原本复杂的问题解决方式转变为自然语言的形式！

May 2, 2024

每家大语言模型公司都在挑战搜索技术：未来的大语言模型检索系统展望 [译]

搜索技术是计算机科学中极具挑战性的领域之一，仅有少数产品如 Google、Amazon 和 Instagram 能够做到出色。直至不久前，大多数产品并不依赖高效的搜索功能——它并非用户体验的关键部分。然而，随着大语言模型及其检索系统的迅猛发展，每个大语言模型公司都迫切需要将顶尖的搜索功能融入产品中，以确保其正常运作。面对这种新兴的需求，新一代 AI 公司将如何解决搜索问题？检索功能是大语言模型系统不可或缺的组成部分，这一点未来也不会改变。

May 2, 2024

Perplexity 产品开发的新模式 [译]

Perplexity 的联合创始人兼产品负责人 Johnny Ho 分享了他如何借助 AI 技术领导团队，如同指挥黏菌一般，构建他们的 AI 公司，以及更多前沿策略

May 2, 2024

提高提示一致性的结构化生成方法 [译]

最近，Hugging Face 的 *Leaderboards and Evals* 研究团队进行了一系列小实验，揭示了评估结果对提示格式微小变化的极高敏感性。对于特定任务，即使是很小的提示变动也会导致结果大不相同，这并非我们所希望看到的：相同信息输入的模型，其输出应保持一致性。我们与 *Dottxt* 的合作伙伴探讨了这一问题，他们提出了一个新思路：是否有办法提升不同提示格式之间的一致性？现在，让我们来详细探讨这一点。

May 1, 2024

Rabbit R1: 几乎无法评测 [译]

这就是 Rabbit R1，它是一个装在盒子里的 AI，可以说是时代的象征。这个设备和 Humane AI Pin 有许多相似之处，不论是好是坏。不过，它也有两个所谓的独特之处，这些特点使它与 Humane AI Pin 区别开来。不管怎样，我们需要讨论一下这个问题。如果你觉得听起来熟悉，随时打断我，看看这个。

April 30, 2024

我们得聊聊 Rabbit R1 这款设备... [译]

这个视频主要介绍和点评了一款名为 Rabbit R1 的人工智能硬件助手。作者认为，作为一款售价 200 美元的消费级产品，R1 在设计和功能上还存在诸多不足之处，如滚轮交互体验欠佳、屏幕和音频表现一般、电池续航短等。同时，作者质疑 R1 这类 AI 硬件助手的实用价值，认为类似功能完全可以通过手机上的软件应用来实现。展望未来，作者预测一旦科技巨头们在自家移动操作系统中原生集成类似的 AI 助手功能，第三方的 AI 硬件设备将難以与之竞争。作者呼吁，硬件厂商在发布产品前应该给予评测者和消费者足够的时间去全面体验，不要盲目追赶所谓的"发布窗口期"。与其囿于硬件形态，不如把更多精力投入到底层 AI 技术的研发中来。

April 29, 2024

7 个帮助最小化 RAG 模型风险的指标 [译]

今天我们要学习如何使用关键指标评估 RAG。

April 29, 2024

Ilya——塑造世界的人工智能科学家 [译]

如今，AI 是一项伟大的科技，因为 AI 将解决我们现在面临的所有问题。它能解决就业问题，能治疗疾病，能消除贫困，但同时它也会带来新的问题。假新闻将会愈演愈烈，网络攻击将变得更加严重，我们将面临全自动的 AI 武器的问题。我认为 AI 有潜力创造出无比稳定的独裁统治。

April 28, 2024

No Priors 第 61 集 | 采访 OpenAI 的 Sora 团队负责人 Aditya Ramesh、Tim Brooks 和 Bill Peebles [译]

嗨，亲爱的听众们。欢迎收听"No Priors"的另一期节目。今天，我们有幸与 OpenAI 的 Sora 团队进行交谈，Sora 是一种新的生成式视频模型，能够接受一段文本提示词，然后返回一段视频剪辑高清、视觉连贯的，长达一分钟。Sora 也引起了人们的思考，即这些大规模的视频模型是否是世界模拟器，同时它把可扩展的 Transformer 架构应用到了视频领域。我们今天的嘉宾就是 Sora 的团队成员们。Aditya Ramesh、Tim Brooks 和 Bill Peebles。欢迎来到"No Priors"，各位。

April 26, 2024

实际使用 SORA [译]

2024 年 2 月，我们首次报道了 OpenAI 发布的 SORA，当时我们将其形容为视频领域的 DALL·E。SORA 是一个生成时间更长、内容更连贯的视频的扩散模型。OpenAI 通过使模型能预见多帧内容，成功解决了视频主体即便短暂消失也能保持连贯性的技术难题。目前，SORA 能够一次性生成长达一分钟的完整视频。OpenAI 还表示，未来可能进一步扩展视频的长度，甚至实现两段视频的无缝连接。

April 26, 2024

台积电在美国郊区建造芯片工厂的艰辛历程 [译]

工期延误以及台湾和美国同事之间的紧张关系正在困扰着这家芯片巨头在凤凰城的扩张。

April 25, 2024

Meta 宣布推出 Llama 3 [译]

Meta 宣布推出 Llama 3 的介绍视频文稿，里面介绍了很多 Llama 3 的细节。

April 24, 2024

从一个卡车司机到 38 岁成为 Ruby on Rails 开发者 [译]

从这篇文章讲述了 Pedro David Garcia Lopez 的转变故事，他在 38 岁高龄从卡车司机转职成为了一个 Ruby on Rails 开发者，挑战了业界对年龄的固有偏见完全是无稽之谈！Pedro 的经历在 LinkedIn 上激励了我。

April 23, 2024

硅谷女孩采访 Perplexity 创始人 Aravind [译]

遇见阿拉温德，这位来自印度的创新者，他辞去 OpenAI 的工作，决心要挑战 Google - 和玛丽娜·莫吉尔科的深入对话。新一代搜索引擎将会是什么样？让我们和阿拉温德·斯利尼瓦斯一起发现，他从印度来到美国，带着 AI 的力量来革新在线搜索体验。

April 22, 2024

首页

什么时候该用多智能体是不是一定要用多智能体？

当 AI 能考上一本，十年寒窗苦读还有意义吗？

升级到 GPT-4o 后使用提示词的五项调整 [译]"

蔡崇信谈为什么阿里巴巴全力投入 AI [译]

HeyGen CEO 徐卓（Joshua Xu）访谈 [译]

AI 是功能还是产品？ [译]

优化 Character.AI 的 AI 推理 [译]

在对 500 万个自由职业工作的分析后发现这些工作岗位最可能被 AI 替代 [译]

人工智能无处不在：改变世界，赋予人类力量 [译]

黃仁勳旋風席捲台灣 方念華獨家專訪！

发现提示工程——提示工程就是为了从生成式 AI 中获取有用输出而设计有效提示词的过程 [译]

Prompt 高级技巧：借助伪代码精准的控制 LLM 的输出结果和定义其执行逻辑

小技巧：GPT 多了怎么管理？

计算机专业还值得报考吗？

AI 民科和 AI 科学家之间的差距

苹果新推出的设备内及云端服务器基础模型介绍 [译]

探索检索和评估相关上下文的挑战 [译]

最佳论文 [译]

使用大语言模型 (LLMs) 构建产品一年后的经验总结 [译]

测试 Chrome 内置 Gemini Nano 大语言模型 (4bit 3.25B) 的方法

问答：有校对好的视频文稿如何用文稿纠正字幕错误？

问答：如何使用 GPT 知道我写 R 代码？

什么是提示词注入攻击？ [译]

NVIDIA 公布了到 2027 年的 GPU 和互连路线图 [译]

使用大语言模型 (LLMs) 构建产品一年后的经验总结 (第二部分)[译]

为什么对于有的人来说 ChatGPT 并没有什么卵用？

使用大语言模型 (LLMs) 构建产品一年后的经验总结 (第一部分) [译]

谷歌搜索秘籍泄漏：揭秘内部工程文档 [译]

数千份谷歌搜索 API 的泄露文件曝光，SEO 从业者必看 [译]

映射大语言模型的思维 [译]

使用 NSFW 聊天机器人模拟人类 - 与 Jesse Silver 对话 [译]

你好 GPT-4o [译]

AlphaFold 3 揭示生命分子的秘密结构及其相互作用 - Isomorphic 实验室 [译]

ChatGPT 提示词十级技巧：从新手到专家 [译]

我如何夺冠新加坡首届 GPT-4 提示工程大赛 [译]

Sam Altman 在斯坦福创业者思维领导研讨会上的对话 [译]

提示工程的基本理念以及如何将这些理念应用于提升大语言模型的性能 [译]

每家大语言模型公司都在挑战搜索技术：未来的大语言模型检索系统展望 [译]

Perplexity 产品开发的新模式 [译]

提高提示一致性的结构化生成方法 [译]

Rabbit R1: 几乎无法评测 [译]

我们得聊聊 Rabbit R1 这款设备... [译]

7 个帮助最小化 RAG 模型风险的指标 [译]

Ilya——塑造世界的人工智能科学家 [译]

No Priors 第 61 集 | 采访 OpenAI 的 Sora 团队负责人 Aditya Ramesh、Tim Brooks 和 Bill Peebles [译]

实际使用 SORA [译]

台积电在美国郊区建造芯片工厂的艰辛历程 [译]

Meta 宣布推出 Llama 3 [译]

从一个卡车司机到 38 岁成为 Ruby on Rails 开发者 [译]

硅谷女孩采访 Perplexity 创始人 Aravind [译]

黃仁勳旋風席捲台灣方念華獨家專訪！