针对智能体的用户体验设计,第三部分:电子表格、生成式和协作式 UI/UX [译]
了解批量处理智能体工作负载的电子表格用户体验、生成式 UI 以及与智能体协作的用户体验。
October 11, 2024
View Article翻译的一些我觉得不错的科技文章。
了解批量处理智能体工作负载的电子表格用户体验、生成式 UI 以及与智能体协作的用户体验。
October 11, 2024
View Article我们将讨论后台运行的智能体,它可以同时处理多个任务,并探讨它们如何应用于您的工作流程。
October 11, 2024
View Article人与计算机的交互已经研究了很多年。我相信在未来几年,人与智能体的交互也将成为一个重要的研究领域。
October 11, 2024
View Article智能体规划的意义以及如何提升规划能力。
October 11, 2024
View Article了解为什么你应该根据应用定制认知架构,并运行更好的智能体应用基础设施。
October 11, 2024
View Article“认知架构”一词在神经科学和计算认知科学中有着 悠久的历史 。根据维基百科的定义,“认知架构”既指关于人类思维结构的理论,也指该理论的计算实现。这一定义(以及相关的研究和文章)比我在此提出的定义更全面,本篇博文应被视为我在过去一年中构建和帮助构建基于大语言模型(LLM)的应用程序经验与该研究领域的映射。
October 11, 2024
View Article💡智能体是一个使用大语言模型(LLM)来决定应用程序控制流的系统。
October 11, 2024
View Article本文深入探讨了生成式AI的新阶段,揭示了从“快速反应”到“深度推理”的转变趋势。随着微软、OpenAI等科技巨头在AI基础层的主导地位日益稳固,未来的焦点将转向AI推理能力的提升,比如OpenAI的最新模型o1,它具备在推理时“停下来思考”的能力,不再仅仅依赖预训练数据的模式匹配。这一推理能力的进化将引领AI进入全新的智能应用时代,帮助AI解决复杂任务,创造巨大市场机会。文章还指出,未来AI或将实现类似AlphaGo超人表现的突破,真正展现出接近人类思维的能力。
October 10, 2024
View Article作为一个新兴的研究领域,提示词工程尚未有明确的技术分类。当你查看各种讨论这些技术的文章和网站时,你会发现它们风格各异,且缺乏系统性。因此,实践者通常会采用最简单的方法。在本文中,我将为提示词工程技术提供一个概览,并提出一个清晰的分类,这将帮助你更好地理解这些概念并有效应用它们。此外,我还将探讨如何将提示词工程作为一个数据科学过程进行,其中包括提示词微调和评估。
September 28, 2024
View Article在 AI 时代,懂一点多领域知识比只懂一个领域的深度知识更有价值
September 28, 2024
View Article在 2024 年 T-Mobile Capital Markets Day 上,OpenAI CEO Sam Altman 的一段访谈。OpenAI 新发布的推理模型 o1 preview 相当于 GPT-2 时刻,但是升级曲线会很陡峭,意味着很快就会达到它的 GPT-4 时刻。AI 的五个发展阶段。第一个阶段是聊天机器人。第二个阶段,也就是我们现在刚刚达到的,是推理系统。第三阶段是 AI 智能体。第四阶段是创新者,具有发现新科学信息的能力。第五阶段是完整的组织。从第一阶段过渡到第二阶段花费了一段时间,第二阶段能相对较快地推动第三阶段 AI 智能体的发展。OpenAI 不会用 API 调用的数据后者训练的数据来训练他们的模型。OpenAI 成功的秘诀是因为有坚定的信念和保持专注,能保持研究方向的聚焦。坚信深度学习的力量,相信可以从现有的状态一路走到通用人工智能(AGI)甚至更远,尽最大努力做得最好,并试图保持研究方向的聚焦。与此同时,会根据前进过程中学到的新知识来调整方向。尽全力去完成每一个任务,随着时间的推移,就能产生积累效应。看好未来 AI 在医疗保健领域、教育领域和科学研究领域上的贡献。
September 19, 2024
View Article通过生产化测试时间计算揭示 AI 的未来。探索已经在语言模型训练中应用。
September 17, 2024
View ArticleArtifacts 背后的团队——一种与 Claude 互动的新颖方式——分享了他们如何在三个月内通过分布式团队打造这一功能的独家细节。
August 29, 2024
View ArticleTownie 在过去的几周内已经彻底重新设计。它在编写全栈应用方面非常厉害。这篇文章讲述了我几周前是如何为这个新版的 Townie 制作原型的。
August 24, 2024
View Article一些用于 Apple 即将推出的 AI 功能的预提示说明存储在你的 Mac 上,这些说明要求“不要生成虚假信息”和避免“负面”主题。
August 6, 2024
View Article在 Character.AI,掌握提示词工程的艺术与科学至关重要。在实际应用中构建提示词需要考虑广泛的数据和因素:当前的对话模式、正在进行的实验、所涉及的角色、聊天类型、各种用户属性、固定记忆、用户角色、整个对话历史等等。鉴于我们每天构建数十亿条提示词、需要最大化利用不断扩展的大语言模型(LLM)上下文窗口,以及我们的用例多样性,一个强大且可扩展的提示词设计方法是必不可少的。我们倡导从传统的“提示词工程”转向“提示词设计”——这种转变使我们远离繁琐的字符串操作,转而设计精确且引人入胜的提示词。这篇文章介绍了我们开发的 Prompt Poet,一个专门解决提示词设计问题的工具。
August 2, 2024
View ArticleCohere Prompt Tuner 使用可定制的优化和评估循环来改进 LLM Prompt,基于 Google Deepmind 的论文 OPRO (Optimization by Prompting) 方法,使用 LLM 驱动的评估结果来迭代优化 Prompts。
July 31, 2024
View Article今天,我们宣布了 Meta Segment Anything Model 2(SAM 2),这是 Meta Segment Anything Model 的下一代产品,现在支持在视频和图像中进行对象分割。我们在 Apache 2.0 许可证下发布了 SAM 2,因此任何人都可以使用它来构建自己的体验。我们还共享了用于构建 SAM 2 的数据集 SA-V,并在 CC BY 4.0 许可证下发布,还推出了一个基于网页的演示体验,人人都可以试用我们模型的一个版本。
July 30, 2024
View Article在研究了公司如何部署生成式 AI 应用程序后,我注意到它们的平台有许多相似之处。本文概述了生成式 AI 平台的常见组件、它们的功能以及如何实现。我尽量保持架构的通用性,但某些应用程序可能会有所不同。以下是总体架构的样子。
July 30, 2024
View Article我一直认为_提示词注入_是诱导模型做坏事,而_越狱_是特意诱导它做出违反公司服务条款的事情,通常是在聊天机器人中(因此,越狱是提示词注入的一部分)。但最近在 X 上的一次对话彻底改变了我的想法。我将从我对这些概念的新理解开始,因为这可能是你最关心的内容。然后,我会介绍那次改变我看法的对话,最后是我如何形成错误观点的过程。
July 29, 2024
View Article我认为很多人对 GenAI 革命有一个基本疑问,那就是这些模型表面上展示的智能究竟来自哪里。在本文中,我将尝试用简单的术语解释生成式 AI 模型的工作原理,而不使用高级数学,帮助你将它们看作计算机算法,而不是魔法。
July 29, 2024
View Article自从 ChatGPT 于 2022 年 12 月发布以来,GoDaddy 在 AI 方面进行了大量投资。在此期间,我们在众多项目中利用大语言模型(LLM)帮助客户创建网站内容、社交营销活动、设计标志,甚至为他们的项目找到最佳域名。我的团队——数字关怀团队,利用 LLM 在我们的消息渠道(短信、WhatsApp 和网络)中提供卓越的客户体验。GoDaddy 每天在我们的消息渠道中收到超过 60,000 个客户联系。许多对话开始于与我们某个机器人进行互动。我们对 LLM 技术在客户支持中的应用充满了期待和兴奋。早期实验表明,LLM 的表现优于旧的自然语言处理单元;然而,运营 LLM 并非易事。我们在运营这些模型的过程中学到了很多经验教训,这篇文章讨论了这些发现。
July 28, 2024
View Article在过去的六个月里,我们在 LinkedIn 的团队一直在努力开发一种新的 AI 驱动体验。我们希望重新定义会员们进行工作搜索和浏览专业内容的方式。
July 28, 2024
View Article这次 Windows 蓝屏是一个由于 C++ 语言的不安全内存导致的空指针问题。
July 20, 2024
View Article近年来,随着大语言模型 (LLM) 的发展,构建检索增强生成 (RAG) 解决方案成为了一个热门话题。RAG 将 LLM 的强大功能与检索模型结合,应用于专有知识数据库。然而,对于开发人员来说,一个主要挑战是将各种文档格式(如 PDF、HTML 等)转换为可供文本模型处理的格式。
July 17, 2024
View Article利用 Ragas, TruLens 和 DeepEval 对一年级阅读理解练习进行上下文相关性评估的案例研究
July 12, 2024
View ArticleOpenAI 联合创始人 Andrej Karpathy 解释了新的计算范式:“我们正在进入一个新的计算范式,大语言模型就像 CPU 一样,使用 Token 而不是字节,并且有一个上下文窗口而不是 RAM。这就是大语言模型操作系统(Large Language Model OS, LLMOS)。”
July 3, 2024
View Article马克·扎克伯格前几天接受了 Robin Kallaway 的采访,讨论了未来的技术发展,尤其是智能眼镜、神经腕带和 AI 技术在创作者和小企业中的应用
June 30, 2024
View ArticleChatGPT 比以前更好用了,但我发现要想最大限度地利用它,您必须对现在的提示方式与使用 GPT-3.5 时的提示方式进行 5 项调整。我们将介绍 GPT-4o 的新功能,以及您的提示需要如何更新。
June 24, 2024
View Article这是今年五月蔡崇信在 2024 年摩根大通全球中国峰会期间炉边会谈的视频。在与关金星的 30 分钟对话中,蔡崇信概述了人工智能如何推动他 25 年前共同创立的公司在核心电商业务或云部门的增长。
June 23, 2024
View ArticleAI 视频生成模型在制作引人入胜和复杂视频方面还有很长的路要走,但 HeyGen 团队正在通过使用语言、视频和语音模型来简化视频制作过程,从而创建包含个性化头像、插图(b-roll)和对话的视频。本周在“No Priors”节目中,HeyGen 的联合创始人兼 CEO Joshua Xu 加入了 Sarah 和 Elad 的讨论,介绍 HeyGen 团队如何分解视频的各个元素,并为每个元素构建或找到相应的模型,这些 AI 视频的商业应用,以及他们如何防范深度伪造(deep fakes)。
June 23, 2024
View ArticleThe new Siri vs the RabbitR1 and Humane pin
June 22, 2024
View Article在 Character.AI,我们正朝着通用人工智能 (AGI) 的目标迈进。在未来,大语言模型 (LLMs) 将会增强我们的日常生活,不仅提高商业生产力和娱乐效果,还能在教育、教练、支持、头脑风暴、创意写作等方面提供帮助。要在全球实现这一愿景,关键在于实现高效的“推理”,即 LLM 生成回复的过程。作为一家全栈 AI 公司,Character.AI 从头开始设计其模型架构、推理架构和产品,创造了独特的机会来优化推理,使其更高效、更具成本效益,并能扩展以满足快速增长的全球用户需求。
June 21, 2024
View Article毫无疑问,人工智能 (AI) 将对工作产生影响。但是,哪些工作更有可能被 AI 替代?哪些工作现在已经在被 AI 替代?为了找到答案,我决定查看实实在在的数据:从 2022 年 11 月 1 日(ChatGPT 发布前一个月)到 2024 年 2 月 14 日,Upwork 上的实际自由职业工作数据,看看哪些工作受到了最大的负面影响。
June 21, 2024
View Article达特茅斯工程学院与校友、OpenAI 首席技术官 Mira Murati Th'12 举行了一场独家对话。她讨论了 ChatGPT 和 DALL·E 背后的人工智能(AI),以及正在进行的安全和伦理考量及未来的影响。
June 21, 2024
View Article黃仁勳旋風席捲台灣 方念華獨家專訪!Exclusive Interview with NVIDIA CEO Jensen Huang 20240616 (完整版)
June 19, 2024
View Article我叫 Yufeng,我在 Google 担任工程师。我对设计提示词感兴趣的最初动机是因为从语言模型中获取有用的回应需要花费大量时间。有时候,我们甚至在不使用 AI 的情况下也能更快地完成工作。我希望能使我们的工具更加高效,而不是效率更低。我很高兴能帮助你更深入地了解如何设计有效的提示词。
June 19, 2024
View Article在 2024 年全球开发者大会上,我们向大家展示了苹果智能系统,这是一套深度融入 iOS 18、iPadOS 18 及 macOS Sequoia 的个人智能体系。这一系统集成了多个功能强大的生成式 AI,专为处理用户日常需求而设计,能够根据用户当前的活动实时调整。苹果智能中的基础模型经过专门微调,以优化各种用户体验,如文本编写、通知的排序与摘要、为家庭及朋友对话创造有趣的图像,以及简化应用间的交互操作。
June 11, 2024
View Article利用 Ragas, TruLens 和 DeepEval 对一年级阅读理解练习进行上下文相关性评估的案例研究
June 11, 2024
View Article虽然这篇文章的标题称其为“最佳论文”,但实际上并非如此。我的目标是探索一篇真正的最佳论文应具备的特质。
June 11, 2024
View Article现在是使用大语言模型 (LLMs) 构建产品的激动人心的时刻。在过去的一年中,LLMs 的表现已经“足够好”可以应用于现实世界。LLMs 改进的速度,加上社交媒体上的大量演示,将推动预计到 2025 年 AI 投资达到 2000 亿美元。LLMs 的广泛可用性,让每个人,而不仅仅是机器学习工程师和科学家,都能在他们的产品中构建智能。虽然构建 AI 产品的门槛已经降低,但要创建那些不仅仅是演示效果好的产品,仍然充满挑战。
June 9, 2024
View Article我们将介绍提示词注入的工作原理、常见类型以及潜在的风险和后果。你将了解提示词注入如何使得系统生成错误信息、编写恶意软件,甚至可能导致数据泄露和系统远程接管。视频还会探讨应对提示词注入的多种方法,包括数据审查、最小权限原则、人类反馈强化学习等。
June 5, 2024
View Article在计算、网络和图形的发展历史上,Nvidia 有许多独特之处。此刻,它拥有大量资金,并且凭借其架构、工程和供应链在生成式 AI (generative AI) 市场中占据了领先地位,使其能够随心所欲地制定任何可能带来进展的路线图。
June 4, 2024
View Article运营大语言模型应用程序提出了一些在运营传统软件系统时熟悉的问题,但通常有新的变化来保持新鲜感。大语言模型应用程序还提出了全新的问题。我们将这些问题及其答案分为四部分:数据、模型、产品和团队。
June 4, 2024
View Article现在是使用大语言模型 (LLMs) 构建产品的激动人心的时刻。在过去的一年中,LLMs 的表现已经“足够好”可以应用于现实世界。LLMs 改进的速度,加上社交媒体上的大量演示,将推动预计到 2025 年 AI 投资达到 2000 亿美元。LLMs 的广泛可用性,让每个人,而不仅仅是机器学习工程师和科学家,都能在他们的产品中构建智能。虽然构建 AI 产品的门槛已经降低,但要创建那些不仅仅是演示效果好的产品,仍然充满挑战。
May 30, 2024
View Article探索你一直渴望了解的谷歌算法的秘密。
May 29, 2024
View Article2024 年 5 月 5 日,我收到一封电子邮件,发件人称得到谷歌搜索部门大量泄漏的 API 文档集的访问权限。邮件还提到,这些泄露文件已经得到前谷歌员工的验证,证实其真实性,并且这些前员工及其他人还透露了更多关于谷歌搜索操作的秘密信息。
May 28, 2024
View Article今天,我们在理解 AI 模型内部机制方面取得了重大突破。我们已经识别出数百万个概念在 Claude Sonnet(一种我们部署的大语言模型)中的表示方式。这是首次对现代生产级大语言模型的内部进行详细研究。这一发现有助于未来提升 AI 模型的安全性。
May 21, 2024
View Article利用开源的大语言模型 (LLM) 和 DSPy 技术来缓解提示注入问题,我们开发了迄今为止最先进的 AI 电子商务聊天机器人,使 OnlyFans 网红的收入提高了 2-5 倍。
May 18, 2024
View ArticleGPT-4o(“o”代表“omni 全方位”)能够实时处理音频、视觉和文本信息,使人机交互更加自然流畅。这款模型支持多种输入(文本、音频、图像)和输出(文本、音频、图像)模式,其响应音频的速度极快,最快可达 232 毫秒,平均响应时间为 320 毫秒,与人类在对话中的反应速度相当。无论是处理英语文本还是代码,GPT-4o 的表现堪比 GPT-4 Turbo,而在处理非英语文本方面则有了显著提升,同时运行速度更快,API 成本也减少了 50%。特别是在视觉和音频理解方面,GPT-4o 表现远超以往模型。
May 14, 2024
View Article