翻译

翻译的一些我觉得不错的科技文章。


跨界思考:大语言模型中创意幽默生成的新思维探索 [译]

我们构建了一个新的框架,这个框架可以帮助我们更好地理解通用人工智能(AGI)及其早期版本的能力和表现。这个框架详细划分了 AGI 的性能、适用范围和自我控制能力的不同层次。我们希望,这个框架能够像划分自动驾驶技术等级一样,为人们提供一种通用的语言,以便比较不同的 AGI 模型,评估它们可能带来的风险,并跟踪我们在实现 AGI 这一目标道路上的每一步进展。为了建立这个框架,我们审视了 AGI 的现有定义,并从中提炼出六大原则,以构建一个实用的 AGI 分类体系。这些原则强调重视 AGI 的实际能力,而不仅仅是其背后的技术机制;它们建议我们应当分开评估 AGI 的适用范围和性能水平;并且我们不应该只着眼于最终目标,而应该明确标记出通向 AGI 的每一个阶段。基于这些思路,我们根据 AGI 的能力深度(即性能)和广度(即适用范围)提出了“AGI 等级”,并且对当前系统如何符合这个分类体系进行了思考。我们还讨论了未来评估 AGI 行为和能力的基准测试所面临的挑战。最后,我们探讨了这些 AGI 的不同层次如何与实际部署时的自主性和风险管理相结合,并强调在部署高级 AI 系统时,选择合适的人机交互方式对于确保系统的负责任和安全使用至关重要。

December 18, 2023

View Article

OpenAI 生产环境最佳实践官方指南 [译]

这份指南全面介绍了如何将产品原型发布到生产环境的最佳实践。不论你是资深的机器学习工程师还是刚入门的技术爱好者,这份指南都能为你提供在实际生产环境中成功应用该平台所需的各种工具和知识。内容涵盖从如何保护 API 访问安全到如何构建能应对高流量的架构。参考这份指南,可以帮助你更顺畅、高效地部署应用程序到生产环境。

December 17, 2023

View Article

大语言模型在帮助医生获取信息方面效果如何?[译]

斯坦福大学的专家们对 GPT-4 在辅助医生进行简便咨询方面的安全性和准确性进行了探究。

December 17, 2023

View Article

OpenAI 官方提示工程指南 [译]

这份指南旨在分享如何更有效地利用像如 GPT-4 这样的大语言模型(有时候也叫 GPT 模型)来获得更好的结果。介绍的方法可以相互结合,以发挥更大的作用。我们鼓励你进行实验,寻找最适合你的技巧。

December 16, 2023

View Article

如何用计算思维看待人工智能、宇宙与万物 [译]

人类的语言、数学和逻辑,这些都是我们解读世界的工具。在当今世纪,出现了一种新的、更加强大的工具:计算。在过去近 50 年中,我有幸基于这个计算概念,建立起一座越来越高的科学技术之塔。今天我想和大家分享,这一路走来,我们发现了什么。

December 16, 2023

View Article

提升软件工程效率的小技巧:留点悬念,让工作更流畅 [译]

4 个改变我工作效率的编程习惯

December 15, 2023

View Article

提示工程指南 [译]

发掘大语言模型 (LLMs) 的巨大潜能!🚀

December 15, 2023

View Article

FunSearch:利用大语言模型在数学科学领域探索新奇发现 [译]

通过搜索编写在计算机代码中的“函数”,FunSearch 利用大语言模型 (LLMs) 首次在数学科学的未解之谜中取得突破

December 15, 2023

View Article

大语言模型真的需要这么多层吗? [译]

研究表明,移除 70% 的注意力头和 20% 的前馈网络对上下文学习影响甚微,这暗示大语言模型或许训练得不够充分。

December 15, 2023

View Article

探讨人工智能对经济的影响 [译]

人工智能对经济的影响将受到其技术发展和实施的速度与有效性的双重影响。我们在这里分享我们对这个日渐丰富的研究领域的理解和我们如何实时跟踪这一发展趋势。

December 15, 2023

View Article

开发者视角:项目管理的智慧 [译]

谈谈如何管理一个软件项目。

December 14, 2023

View Article

如何避免 12 大软件架构常见误区 [译]

虽然构建成功的软件架构的过程看似简单,实际上却颇具挑战。要理解 QARs,并在此基础上做出最优权衡,需要深刻的洞察力和丰富的经验,而这些往往需要通过对架构本身的不断试验和调整来积累。虽然过程本质上不复杂,但所涉及的权衡决策通常充满挑战,而且难以找到简单的解决方案。

December 14, 2023

View Article

AI 时代的商业市场新风貌 [译]

在不断演进的市场商业模式中,每一种新兴平台都在重新定义交易的方式和地点。互联网时代,我们从传统的分类广告和布告栏转向了亚马逊(Amazon)、eBay 和克雷格列表(Craigslist)这样的网站;而移动互联网时代,则催生了 DoorDash、优步(Uber)和 Instacart 这样的应用程序。现在,生成式 AI(Generative AI)技术的兴起预示着市场将迎来又一次革新。它不仅将改变商品和服务的销售方式,更重要的是,它也将改变这些商品和服务的制造方式。

December 14, 2023

View Article

2024 年科技领域的重大创新思想 [译]

智能能源网格、语音先行的伴侣应用、可编程药品、针对儿童的 AI 工具。我们向 a16z 的超过 40 位合作伙伴征询了他们认为将在 2024 年成为创新动力的重要理念。

December 14, 2023

View Article

在 iPad 或 iPhone 上本机离线运行大语言模型 [译]

本教程将指导您如何在苹果设备上本地安装一个类似于 ChatGPT 的大语言模型(LLM)。

December 13, 2023

View Article

开发者与企业,是时候用 Gemini Pro 打造你的应用了 [译]

想了解如何将 Gemini Pro 融入你的应用或业务,请访问 ai.google.dev。

December 13, 2023

View Article

人工智能辅助程序员的三种类型 [译]

像 ChatGPT 这样的大语言模型 (LLM) 能够编写引人信服的代码片段。2023 年初,这一发现在 LinkedIn 上引起了不少热议,许多人误以为这意味着不再需要经验丰富的开发人员及其专业知识、挑剔的态度和高昂的薪酬了。如今,任何一个有网络连接的人似乎都能轻而易举地让 AI 编写下一个大型社交媒体应用,用 JavaScript 编写,并融合一些区块链技术。

December 13, 2023

View Article

大语言模型 API 市场的变迁之路 [译]

随着越来越多公司加入这个领域,大语言模型 API 市场将如何发展?

December 13, 2023

View Article

利用 AI 进行角色扮演:对作家和教育者来说是个重要工具 [译]

或者说,GPT-4 能有多好地模拟 1963 年的 LSD 旅程?

December 13, 2023

View Article

人工智能即将全面改变我们使用电脑的方式 [译]

人工智能即将全面改变我们使用电脑的方式并彻底重塑软件行业。

December 13, 2023

View Article

Phi-2:小语言模型的非凡实力 [译]

近几个月里,微软研究院的机器学习基础团队推出了一系列被命名为“Phi”的小型语言模型(SLMs),在众多基准测试中表现卓越。

December 12, 2023

View Article

功能标记(Feature Flags)管理指南 [译]

在软件开发这个不断演变的领域,迅速适应、实验和高效发布功能显得至关重要。功能标记(Feature Flags),也称为功能开关,正是这种动态环境的核心。它们赋予开发者将代码部署与功能发布分离的能力,从而提高开发的灵活性,并减少推出新功能时的风险。功能标记为软件发布提供了一种受控且灵活的方法,这在持续集成/持续部署(CI/CD)的环境中尤为重要。本文将深入探讨功能标记的关键原理,并重点介绍在大型系统中实施和管理它们的有效方法。这些方法涉及运行时控制、隐私保护、性能优化和可扩展性,旨在为开发人员、项目经理和决策者提供理论与实践方面的洞见。本指南旨在提供掌握软件开发项目中功能标记的必要知识和策略。

December 11, 2023

View Article

探索编写提示词的乐趣:蒙特卡洛方法、木偶剧和笑声的融合 [译]

内部生产力工具中所采用的各种提示技术。这些技术结合了行业与学术研究以及我们自身的小规模内部开发成果。建议你在自己的评估环境下对这些技术进行测试,并根据你的具体需求进行调整。

December 11, 2023

View Article

深入解析“混合专家模型(Mixtral of Experts)” [译]

自从 Mixtral 8x7B(发布公告、模型说明)亮相以来,“混合专家模型”(Mixture of Experts,简称 MoEs)这类 Transformer 成了开放 AI 领域的焦点话题。在这篇博客中,我们将深入探讨 MoEs 的基础构架、训练方式,以及在实际应用中需要权衡的各种因素。

December 11, 2023

View Article

Mixtral 8x7B -- 混合专家模型(Mixtral of Experts) [译]

Mistral AI 团队致力于为开发者社区提供顶尖的开源模型。在 AI 领域,要实现突破,不仅要超越现有的架构和训练方法,更重要的是让社区能够利用创新模型,激发新的发明和应用。

December 11, 2023

View Article

TBM 258: “只需招募有才华的人并赋予他们权力” [译]

人们常认为,一个杰出的领导者的任务就是招聘员工,并授权他们去做出色的工作。但如果你不深入了解细节,你怎么能判断他们的工作是否出色呢?因此,我确保自己深入到细节中,并且我们真正推动了产品的发展。

December 11, 2023

View Article

深入探索:AI 驱动的 PDF 布局检测引擎源代码解析 [译]

上周,PDF 转 Markdown 的工具 Marker 成为 Hacker News 首页的热门话题。作为一个对机器学习(ML)充满好奇的学生,我觉得这是一个绝佳的机会,深入了解这款出色的文档 AI 工具的内部机制。

December 11, 2023

View Article

什么是“专家混合模型”(Mixture-of-Experts,MoE)? [译]

“专家混合模型”是一种创新的神经网络架构设计,它在 Transformer 架构中融合了众多的专家/模型层。在这种设计中,数据流动时,每一个输入的 Token 都会被动态分配给一些专家进行处理。这种做法使得计算更高效,因为每个专家都能在其擅长的特定任务上发挥出色。

December 10, 2023

View Article

再现亚马逊新的人工智能生成功能:产品评论摘要 [译]

如何使用 OpenAI 大语言模型 (LLM) 在 Weaviate 向量数据库中用 Python 生成摘要,运用所谓的“生成式反馈循环”概念

December 10, 2023

View Article

把大语言模型封装成桌面应用 [译]

最近,我一直忙于开发 Ollama,因此投入了大量时间研究如何在本地系统上运行大语言模型(大语言模型),并探索如何将它们封装进应用程序。一般而言,大部分桌面应用程序只要求用户输入 OpenAI API 密钥,或者从源代码编译 Python 项目即可集成大语言模型。尽管这些方法在理论上可行,但对于许多用户来说,它们的技术门槛仍然较高。我追求的是用户能够一键下载并立即运行的应用程序。

December 10, 2023

View Article

利用客户端技术开发基于大语言模型(LLM)的 Web 应用 [译]

虽然关于通过 OpenAI、Anthropic、Google 等公司的 API 调用 LLM 来构建应用的文章层出不穷,但我选择了一条不同的道路,尝试仅使用本地模型和技术来构建网页应用,尤其是那些能在浏览器中运行的技术!

December 10, 2023

View Article

一些有价值的职场建议 [译]

职业生涯就像是一个漫长的旅程,最难的地方在于你的目的地是未知的,甚至没有地图来指引你如何前行。

December 10, 2023

View Article

Netflix 的技术架构解析 [译]

本文汇集了许多来自 Netflix 工程团队的博客和开源项目的研究成果。如果您在阅读中发现任何不准确之处,请不吝告知。

December 10, 2023

View Article

在 RAG 流程中提高检索效果:融合传统关键词与现代向量搜索的混合式搜索技术 [译]

探讨如何结合传统关键词搜索与现代向量搜索来获得更相关的搜索结果

December 9, 2023

View Article

如何构建高质量软件:一个被忽略的课题 [译]

目前,我主要的工作是兼任部分时间的 CTO 服务。坦白说,在进行创新的同时担任这个角色对我来说颇有挑战。同时兼顾这两者非常艰难,所以我暂时放下创新者的角色,专注于规划发展路线图和招聘事宜。招聘其实是一个挑战,需要精准识别不同职位和所需资源。

December 8, 2023

View Article

为你的生活打造 AI 旁白的指南 [译]

在本文中,我会详细介绍如何打造你专属的 AI 旁白。文章末尾,我还会分享一些实用的代码。

December 8, 2023

View Article

苹果是如何做到严格保密的? [译]

出于恐惧?我早就想分享这个故事了。

December 8, 2023

View Article

如何理解关于 OpenAI Q* 的流言 [译]

OpenAI 还没具体说明 Q* 是什么,但已经透露了许多线索。

December 8, 2023

View Article

检索增强生成(RAG):从理论到 LangChain 实践 [译]

从学术论文的理论到利用 OpenAI、Weaviate 和 LangChain 的 Python 应用实现

December 7, 2023

View Article

12 种调整策略指南:为生产环境打造高效的 RAG 应用 [译]

如何通过这些“超参数”和调整策略优化你的检索增强生成(RAG)流程

December 7, 2023

View Article

为忙碌人士准备的大语言模型(LLM)速览 [译]

这篇博客的灵感完全来自 Andrej Karpathy 在 YouTube 上的视频“忙碌人士的大语言模型速览”。在我看来,这是对大语言模型的最精彩解释。对于更喜欢阅读而不是观看的朋友,这篇文章是你的理想之选。

December 7, 2023

View Article

我们是如何利用大语言模型 (LLM) 改进 GitHub Copilot 的探索之旅 [译]

深入了解我们如何使用生成式 AI 模型进行创新实验,从而拓宽 GitHub Copilot 在开发者整个生命周期中的应用。

December 7, 2023

View Article

针对 Claude 2.1 的长篇幅提示技巧 [译]

Claude 2.1 在处理高达 20 万 Token 的庞大上下文时,检索特定句子的能力令人瞩目。我们通过实验发现,利用精心设计的提示技巧,可以引导 Claude 更准确地回忆出相关信息。

December 7, 2023

View Article

“Emoji”一词的由来 [译]

“emoji”这个词与情绪并无直接关联。很多人误以为“emoji”一词源自“emotion”(情感),其实这只是个巧合。它实际上来自于日语中的“絵”(图片,发音 _eh_)加上“文字”(字母或字符,_mōji_)。简而言之,这个词指的是一种图画文字。尽管这个词本身与“情感”这个词在词源上并无关联,但我们使用 emoji 的方式却能深刻反映我们的自我特性以及我们如何与他人建立联系。

December 6, 2023

View Article

谷歌如何简化代码审查流程,实现 97% 开发者满意度 [译]

很多离开谷歌的工程师表示,他们最怀念的内部工具之一是 Critique,谷歌的代码审查工具。探究谷歌的代码审查工具(Critique):AI 助力的创新与最新统计

December 6, 2023

View Article

Gemini 介绍:我们的超级 AI 模型 [译]

让 AI 更贴近每个人的生活

December 6, 2023

View Article

AI 工程师的崛起 [译]

新兴技能的出现催生了一个新职称:要掌握这些技能,我们需要超越简单的命令行编程,转而开发 软件。

December 6, 2023

View Article

AI 之后软件开发领域的 3 个预测 [译]

必须采用多模型战略,新兴 AI 基础设施的发展,以及大语言模型(LLM)作为新的抽象层次。

December 6, 2023

View Article

RAG 与 GPT-4 的上下文窗口比较:准确性、成本和响应速度 [译]

在大语言模型应用阶段,重点是让回答变得非常具体,无论是针对数据集、用户、使用场景,还是特定的调用请求。

December 5, 2023

View Article

提示工程、RAGs 与微调的对比 [译]

提示工程、RAGs 与微调的对比是每位搭建基于大语言模型(LLM)应用的 AI 工程师都面临的关键选择。

December 5, 2023

View Article