首页


在 iPad 或 iPhone 上本机离线运行大语言模型 [译]

本教程将指导您如何在苹果设备上本地安装一个类似于 ChatGPT 的大语言模型(LLM)。

December 13, 2023

View Article

开发者与企业,是时候用 Gemini Pro 打造你的应用了 [译]

想了解如何将 Gemini Pro 融入你的应用或业务,请访问 ai.google.dev。

December 13, 2023

View Article

人工智能辅助程序员的三种类型 [译]

像 ChatGPT 这样的大语言模型 (LLM) 能够编写引人信服的代码片段。2023 年初,这一发现在 LinkedIn 上引起了不少热议,许多人误以为这意味着不再需要经验丰富的开发人员及其专业知识、挑剔的态度和高昂的薪酬了。如今,任何一个有网络连接的人似乎都能轻而易举地让 AI 编写下一个大型社交媒体应用,用 JavaScript 编写,并融合一些区块链技术。

December 13, 2023

View Article

大语言模型 API 市场的变迁之路 [译]

随着越来越多公司加入这个领域,大语言模型 API 市场将如何发展?

December 13, 2023

View Article

利用 AI 进行角色扮演:对作家和教育者来说是个重要工具 [译]

或者说,GPT-4 能有多好地模拟 1963 年的 LSD 旅程?

December 13, 2023

View Article

人工智能即将全面改变我们使用电脑的方式 [译]

人工智能即将全面改变我们使用电脑的方式并彻底重塑软件行业。

December 13, 2023

View Article

如果 AI 直译 + 意译后的效果还不理想该怎么办?

根据我以前分享过的先直译再意译的 Prompt(参考引用的推文),确实可以大幅提升翻译质量,但也不总是能得到理想的结果。这时候该怎么办?

December 13, 2023

View Article

Phi-2:小语言模型的非凡实力 [译]

近几个月里,微软研究院的机器学习基础团队推出了一系列被命名为“Phi”的小型语言模型(SLMs),在众多基准测试中表现卓越。

December 12, 2023

View Article

2023 年,我患上了 AI 焦虑症

2023 年对我来说是神奇的一年,我意外的从一个程序员变成了一个 AI 资讯届的“网红”,到年底的时候我在 X 平台的阅读量超过 1 亿,微博上的阅读量则超过 10 亿,很多人通过我的微博或者 X 了解最新的 AI 资讯、教程和 Prompt 使用技巧。而这一切其实是从我患上了 AI 焦虑症开始的。我将向你分享我的故事,如何患上了 AI 焦虑症,又是如何克服它,并且成功的把 AI 变成自己的得力助手,让自己成为善用 AI 的人。

December 12, 2023

View Article

功能标记(Feature Flags)管理指南 [译]

在软件开发这个不断演变的领域,迅速适应、实验和高效发布功能显得至关重要。功能标记(Feature Flags),也称为功能开关,正是这种动态环境的核心。它们赋予开发者将代码部署与功能发布分离的能力,从而提高开发的灵活性,并减少推出新功能时的风险。功能标记为软件发布提供了一种受控且灵活的方法,这在持续集成/持续部署(CI/CD)的环境中尤为重要。本文将深入探讨功能标记的关键原理,并重点介绍在大型系统中实施和管理它们的有效方法。这些方法涉及运行时控制、隐私保护、性能优化和可扩展性,旨在为开发人员、项目经理和决策者提供理论与实践方面的洞见。本指南旨在提供掌握软件开发项目中功能标记的必要知识和策略。

December 11, 2023

View Article

探索编写提示词的乐趣:蒙特卡洛方法、木偶剧和笑声的融合 [译]

内部生产力工具中所采用的各种提示技术。这些技术结合了行业与学术研究以及我们自身的小规模内部开发成果。建议你在自己的评估环境下对这些技术进行测试,并根据你的具体需求进行调整。

December 11, 2023

View Article

深入解析“混合专家模型(Mixtral of Experts)” [译]

自从 Mixtral 8x7B(发布公告、模型说明)亮相以来,“混合专家模型”(Mixture of Experts,简称 MoEs)这类 Transformer 成了开放 AI 领域的焦点话题。在这篇博客中,我们将深入探讨 MoEs 的基础构架、训练方式,以及在实际应用中需要权衡的各种因素。

December 11, 2023

View Article

Mixtral 8x7B -- 混合专家模型(Mixtral of Experts) [译]

Mistral AI 团队致力于为开发者社区提供顶尖的开源模型。在 AI 领域,要实现突破,不仅要超越现有的架构和训练方法,更重要的是让社区能够利用创新模型,激发新的发明和应用。

December 11, 2023

View Article

TBM 258: “只需招募有才华的人并赋予他们权力” [译]

人们常认为,一个杰出的领导者的任务就是招聘员工,并授权他们去做出色的工作。但如果你不深入了解细节,你怎么能判断他们的工作是否出色呢?因此,我确保自己深入到细节中,并且我们真正推动了产品的发展。

December 11, 2023

View Article

深入探索:AI 驱动的 PDF 布局检测引擎源代码解析 [译]

上周,PDF 转 Markdown 的工具 Marker 成为 Hacker News 首页的热门话题。作为一个对机器学习(ML)充满好奇的学生,我觉得这是一个绝佳的机会,深入了解这款出色的文档 AI 工具的内部机制。

December 11, 2023

View Article

什么是“专家混合模型”(Mixture-of-Experts,MoE)? [译]

“专家混合模型”是一种创新的神经网络架构设计,它在 Transformer 架构中融合了众多的专家/模型层。在这种设计中,数据流动时,每一个输入的 Token 都会被动态分配给一些专家进行处理。这种做法使得计算更高效,因为每个专家都能在其擅长的特定任务上发挥出色。

December 10, 2023

View Article

再现亚马逊新的人工智能生成功能:产品评论摘要 [译]

如何使用 OpenAI 大语言模型 (LLM) 在 Weaviate 向量数据库中用 Python 生成摘要,运用所谓的“生成式反馈循环”概念

December 10, 2023

View Article

把大语言模型封装成桌面应用 [译]

最近,我一直忙于开发 Ollama,因此投入了大量时间研究如何在本地系统上运行大语言模型(大语言模型),并探索如何将它们封装进应用程序。一般而言,大部分桌面应用程序只要求用户输入 OpenAI API 密钥,或者从源代码编译 Python 项目即可集成大语言模型。尽管这些方法在理论上可行,但对于许多用户来说,它们的技术门槛仍然较高。我追求的是用户能够一键下载并立即运行的应用程序。

December 10, 2023

View Article

利用客户端技术开发基于大语言模型(LLM)的 Web 应用 [译]

虽然关于通过 OpenAI、Anthropic、Google 等公司的 API 调用 LLM 来构建应用的文章层出不穷,但我选择了一条不同的道路,尝试仅使用本地模型和技术来构建网页应用,尤其是那些能在浏览器中运行的技术!

December 10, 2023

View Article

一些有价值的职场建议 [译]

职业生涯就像是一个漫长的旅程,最难的地方在于你的目的地是未知的,甚至没有地图来指引你如何前行。

December 10, 2023

View Article

Netflix 的技术架构解析 [译]

本文汇集了许多来自 Netflix 工程团队的博客和开源项目的研究成果。如果您在阅读中发现任何不准确之处,请不吝告知。

December 10, 2023

View Article

在 RAG 流程中提高检索效果:融合传统关键词与现代向量搜索的混合式搜索技术 [译]

探讨如何结合传统关键词搜索与现代向量搜索来获得更相关的搜索结果

December 9, 2023

View Article

如何构建高质量软件:一个被忽略的课题 [译]

目前,我主要的工作是兼任部分时间的 CTO 服务。坦白说,在进行创新的同时担任这个角色对我来说颇有挑战。同时兼顾这两者非常艰难,所以我暂时放下创新者的角色,专注于规划发展路线图和招聘事宜。招聘其实是一个挑战,需要精准识别不同职位和所需资源。

December 8, 2023

View Article

为你的生活打造 AI 旁白的指南 [译]

在本文中,我会详细介绍如何打造你专属的 AI 旁白。文章末尾,我还会分享一些实用的代码。

December 8, 2023

View Article

苹果是如何做到严格保密的? [译]

出于恐惧?我早就想分享这个故事了。

December 8, 2023

View Article

如何理解关于 OpenAI Q* 的流言 [译]

OpenAI 还没具体说明 Q* 是什么,但已经透露了许多线索。

December 8, 2023

View Article

检索增强生成(RAG):从理论到 LangChain 实践 [译]

从学术论文的理论到利用 OpenAI、Weaviate 和 LangChain 的 Python 应用实现

December 7, 2023

View Article

12 种调整策略指南:为生产环境打造高效的 RAG 应用 [译]

如何通过这些“超参数”和调整策略优化你的检索增强生成(RAG)流程

December 7, 2023

View Article

为忙碌人士准备的大语言模型(LLM)速览 [译]

这篇博客的灵感完全来自 Andrej Karpathy 在 YouTube 上的视频“忙碌人士的大语言模型速览”。在我看来,这是对大语言模型的最精彩解释。对于更喜欢阅读而不是观看的朋友,这篇文章是你的理想之选。

December 7, 2023

View Article

我们是如何利用大语言模型 (LLM) 改进 GitHub Copilot 的探索之旅 [译]

深入了解我们如何使用生成式 AI 模型进行创新实验,从而拓宽 GitHub Copilot 在开发者整个生命周期中的应用。

December 7, 2023

View Article

针对 Claude 2.1 的长篇幅提示技巧 [译]

Claude 2.1 在处理高达 20 万 Token 的庞大上下文时,检索特定句子的能力令人瞩目。我们通过实验发现,利用精心设计的提示技巧,可以引导 Claude 更准确地回忆出相关信息。

December 7, 2023

View Article

“Emoji”一词的由来 [译]

“emoji”这个词与情绪并无直接关联。很多人误以为“emoji”一词源自“emotion”(情感),其实这只是个巧合。它实际上来自于日语中的“絵”(图片,发音 _eh_)加上“文字”(字母或字符,_mōji_)。简而言之,这个词指的是一种图画文字。尽管这个词本身与“情感”这个词在词源上并无关联,但我们使用 emoji 的方式却能深刻反映我们的自我特性以及我们如何与他人建立联系。

December 6, 2023

View Article

谷歌如何简化代码审查流程,实现 97% 开发者满意度 [译]

很多离开谷歌的工程师表示,他们最怀念的内部工具之一是 Critique,谷歌的代码审查工具。探究谷歌的代码审查工具(Critique):AI 助力的创新与最新统计

December 6, 2023

View Article

Gemini 介绍:我们的超级 AI 模型 [译]

让 AI 更贴近每个人的生活

December 6, 2023

View Article

AI 工程师的崛起 [译]

新兴技能的出现催生了一个新职称:要掌握这些技能,我们需要超越简单的命令行编程,转而开发 软件。

December 6, 2023

View Article

AI 之后软件开发领域的 3 个预测 [译]

必须采用多模型战略,新兴 AI 基础设施的发展,以及大语言模型(LLM)作为新的抽象层次。

December 6, 2023

View Article

RAG 与 GPT-4 的上下文窗口比较:准确性、成本和响应速度 [译]

在大语言模型应用阶段,重点是让回答变得非常具体,无论是针对数据集、用户、使用场景,还是特定的调用请求。

December 5, 2023

View Article

提示工程、RAGs 与微调的对比 [译]

提示工程、RAGs 与微调的对比是每位搭建基于大语言模型(LLM)应用的 AI 工程师都面临的关键选择。

December 5, 2023

View Article

构建更佳大语言模型(LLM)应用的四大要诀 [译]

这里为您提供了一些建议和技巧,旨在提高大语言模型应用的精准度,并介绍了选择合适大语言模型的要点。

December 5, 2023

View Article

人工智能是伟大的均衡器 [译]

未来,个性化的 AI 助手将可以在设备上离线运行,将衍生出很多出人意料的创新

December 5, 2023

View Article

令人难以置信!用这项新技术在仅有 4GB GPU 的设备上运行 70B 大语言模型推理 [译]

通常,大语言模型需要大量的 GPU 内存才能运行。但是,有没有可能仅用单个 GPU 来进行推理计算呢?如果可以,最少需要多少 GPU 内存呢?

December 4, 2023

View Article

多面性:大语言模型的语言回音室 [译]

我花了许多时间仔细研究大语言模型(LLM)的输出。有一点引起了我的注意:LLM 生成的文章似乎有一种特殊的…感觉。这种感觉很难用言语描述,但在大语言模型发展的初期,你可以很明显地感觉到自己在阅读一个 AI 生成的文章。

December 4, 2023

View Article

构建企业级大语言模型应用的秘诀:GitHub Copilot 的实践之路 [译]

GitHub Copilot 团队分享了如何打造一个既能满足个人用户也能满足企业用户需求的大语言模型(LLM)应用程序的心得。若你希望利用大语言模型 (LLM) 打造并扩展你的应用程序,这篇文章将是你的不二之选。

December 4, 2023

View Article

构建企业级大语言模型应用的秘诀:GitHub Copilot 的实践之路 [译]

GitHub Copilot 是目前最成功的大语言模型应用之一,可以帮程序员自动生成可用的代码,已经有超过一百万付费用户。GitHub Copilot 开发团队分享了构建这个产品时的经验教训。整个产品的开发历时三年,尽力了三个阶段:发现、实现和扩展。这三个阶段对于其他产品的研发也非常具有借鉴价值。

December 4, 2023

View Article

局外人/边缘人(Outsider)思维与人工智能时代 [译]

在我们的分析领域,不同背景的人才聚集一堂。这已经是众所周知的事实,以至于我们往往对此视而不见。有些人对此感到遗憾,比如会想:“如果我能早些投身于分析领域,了解得更多就好了。”也有人会调整自己的简历,试图营造一种与事实不尽相符的职业连贯性。

December 4, 2023

View Article

ChatGPT 一周年回顾:谁在使用它,用途有哪些,为什么受欢迎? [译]

仅仅一年时间,ChatGPT 已经深入科学研究的各个领域。七位科学家分享了他们关于这个聊天机器人正确与错误用法的认识与体会。

December 4, 2023

View Article

童话故事的策略规划:系统化的战略布局 [译]

传统的童话故事结构与我们的思维方式不谋而合,它能有效地指导我们进行战略问题分析,并制定出每个人都能明白的计划。

December 3, 2023

View Article

如工程师般探究复杂性——以 Ladybird 浏览器为例 [译]

要掌握复杂性的精髓,最佳策略往往是拆解后再重建。这正是一群志愿者,在一位前 Safari 开发者的带领下所做的事情。他们从零开始打造了一个成熟的操作系统 SerenityOS,和一个网络浏览器 Ladybird(这意味着:他们没有复用任何现有模块,比如读取 JPEG 文件的模块)。他们如同真正的工程师一般,出于_乐趣_而投入这项工作。听起来不错,但你可能会怀疑,用这种方式能构建出一个具备所有复杂功能的网络浏览器吗?这正是一个探索工程师如何面对复杂性的故事。

December 3, 2023

View Article

软件开发加速的秘诀:小步快跑 [译]

小步快跑,助你在软件开发中加速前行。

December 3, 2023

View Article

战争与和平 (WarAgent):基于大语言模型的世界大战多智能体模拟 [译]

我们能否在历史的十字路口避免战争?这个问题一直受到个人、学者、政策制定者和组织的关注。在这项研究中,我们试图基于人工智能(AI)和大语言模型(LLMs)的最新进展来回答这个问题。我们提出 WarAgent,一个基于 LLM 的多智能体 AI 系统,用于模拟历史国际冲突中参与国家的决策及其后果,包括第一次世界大战(WWI)、第二次世界大战(WWII)和中国古代的战国时期(WSP)。通过评估模拟的有效性,我们检验了尖端 AI 系统在研究诸如国际冲突这样的复杂集体人类行为的能力及其局限性。在这些模拟中,智能体之间的新兴互动也为检验导致战争的触发因素和条件提供了新视角。我们的发现提供了基于数据和 AI 增强的洞察,可以重新定义我们解决冲突和维持和平的策略。其影响超越了历史分析,提供了一个利用 AI 理解人类历史并可能预防未来国际冲突的蓝图。

December 3, 2023

View Article