大语言模型在帮助医生获取信息方面效果如何?[译]
斯坦福大学的专家们对 GPT-4 在辅助医生进行简便咨询方面的安全性和准确性进行了探究。
December 17, 2023
View Article翻译的一些我觉得不错的科技文章。
斯坦福大学的专家们对 GPT-4 在辅助医生进行简便咨询方面的安全性和准确性进行了探究。
December 17, 2023
View Article这份指南旨在分享如何更有效地利用像如 GPT-4 这样的大语言模型(有时候也叫 GPT 模型)来获得更好的结果。介绍的方法可以相互结合,以发挥更大的作用。我们鼓励你进行实验,寻找最适合你的技巧。
December 16, 2023
View Article人类的语言、数学和逻辑,这些都是我们解读世界的工具。在当今世纪,出现了一种新的、更加强大的工具:计算。在过去近 50 年中,我有幸基于这个计算概念,建立起一座越来越高的科学技术之塔。今天我想和大家分享,这一路走来,我们发现了什么。
December 16, 2023
View Article4 个改变我工作效率的编程习惯
December 15, 2023
View Article发掘大语言模型 (LLMs) 的巨大潜能!🚀
December 15, 2023
View Article通过搜索编写在计算机代码中的“函数”,FunSearch 利用大语言模型 (LLMs) 首次在数学科学的未解之谜中取得突破
December 15, 2023
View Article研究表明,移除 70% 的注意力头和 20% 的前馈网络对上下文学习影响甚微,这暗示大语言模型或许训练得不够充分。
December 15, 2023
View Article人工智能对经济的影响将受到其技术发展和实施的速度与有效性的双重影响。我们在这里分享我们对这个日渐丰富的研究领域的理解和我们如何实时跟踪这一发展趋势。
December 15, 2023
View Article谈谈如何管理一个软件项目。
December 14, 2023
View Article虽然构建成功的软件架构的过程看似简单,实际上却颇具挑战。要理解 QARs,并在此基础上做出最优权衡,需要深刻的洞察力和丰富的经验,而这些往往需要通过对架构本身的不断试验和调整来积累。虽然过程本质上不复杂,但所涉及的权衡决策通常充满挑战,而且难以找到简单的解决方案。
December 14, 2023
View Article在不断演进的市场商业模式中,每一种新兴平台都在重新定义交易的方式和地点。互联网时代,我们从传统的分类广告和布告栏转向了亚马逊(Amazon)、eBay 和克雷格列表(Craigslist)这样的网站;而移动互联网时代,则催生了 DoorDash、优步(Uber)和 Instacart 这样的应用程序。现在,生成式 AI(Generative AI)技术的兴起预示着市场将迎来又一次革新。它不仅将改变商品和服务的销售方式,更重要的是,它也将改变这些商品和服务的制造方式。
December 14, 2023
View Article智能能源网格、语音先行的伴侣应用、可编程药品、针对儿童的 AI 工具。我们向 a16z 的超过 40 位合作伙伴征询了他们认为将在 2024 年成为创新动力的重要理念。
December 14, 2023
View Article本教程将指导您如何在苹果设备上本地安装一个类似于 ChatGPT 的大语言模型(LLM)。
December 13, 2023
View Article想了解如何将 Gemini Pro 融入你的应用或业务,请访问 ai.google.dev。
December 13, 2023
View Article像 ChatGPT 这样的大语言模型 (LLM) 能够编写引人信服的代码片段。2023 年初,这一发现在 LinkedIn 上引起了不少热议,许多人误以为这意味着不再需要经验丰富的开发人员及其专业知识、挑剔的态度和高昂的薪酬了。如今,任何一个有网络连接的人似乎都能轻而易举地让 AI 编写下一个大型社交媒体应用,用 JavaScript 编写,并融合一些区块链技术。
December 13, 2023
View Article随着越来越多公司加入这个领域,大语言模型 API 市场将如何发展?
December 13, 2023
View Article或者说,GPT-4 能有多好地模拟 1963 年的 LSD 旅程?
December 13, 2023
View Article人工智能即将全面改变我们使用电脑的方式并彻底重塑软件行业。
December 13, 2023
View Article近几个月里,微软研究院的机器学习基础团队推出了一系列被命名为“Phi”的小型语言模型(SLMs),在众多基准测试中表现卓越。
December 12, 2023
View Article在软件开发这个不断演变的领域,迅速适应、实验和高效发布功能显得至关重要。功能标记(Feature Flags),也称为功能开关,正是这种动态环境的核心。它们赋予开发者将代码部署与功能发布分离的能力,从而提高开发的灵活性,并减少推出新功能时的风险。功能标记为软件发布提供了一种受控且灵活的方法,这在持续集成/持续部署(CI/CD)的环境中尤为重要。本文将深入探讨功能标记的关键原理,并重点介绍在大型系统中实施和管理它们的有效方法。这些方法涉及运行时控制、隐私保护、性能优化和可扩展性,旨在为开发人员、项目经理和决策者提供理论与实践方面的洞见。本指南旨在提供掌握软件开发项目中功能标记的必要知识和策略。
December 11, 2023
View Article内部生产力工具中所采用的各种提示技术。这些技术结合了行业与学术研究以及我们自身的小规模内部开发成果。建议你在自己的评估环境下对这些技术进行测试,并根据你的具体需求进行调整。
December 11, 2023
View Article自从 Mixtral 8x7B(发布公告、模型说明)亮相以来,“混合专家模型”(Mixture of Experts,简称 MoEs)这类 Transformer 成了开放 AI 领域的焦点话题。在这篇博客中,我们将深入探讨 MoEs 的基础构架、训练方式,以及在实际应用中需要权衡的各种因素。
December 11, 2023
View ArticleMistral AI 团队致力于为开发者社区提供顶尖的开源模型。在 AI 领域,要实现突破,不仅要超越现有的架构和训练方法,更重要的是让社区能够利用创新模型,激发新的发明和应用。
December 11, 2023
View Article人们常认为,一个杰出的领导者的任务就是招聘员工,并授权他们去做出色的工作。但如果你不深入了解细节,你怎么能判断他们的工作是否出色呢?因此,我确保自己深入到细节中,并且我们真正推动了产品的发展。
December 11, 2023
View Article上周,PDF 转 Markdown 的工具 Marker 成为 Hacker News 首页的热门话题。作为一个对机器学习(ML)充满好奇的学生,我觉得这是一个绝佳的机会,深入了解这款出色的文档 AI 工具的内部机制。
December 11, 2023
View Article“专家混合模型”是一种创新的神经网络架构设计,它在 Transformer 架构中融合了众多的专家/模型层。在这种设计中,数据流动时,每一个输入的 Token 都会被动态分配给一些专家进行处理。这种做法使得计算更高效,因为每个专家都能在其擅长的特定任务上发挥出色。
December 10, 2023
View Article如何使用 OpenAI 大语言模型 (LLM) 在 Weaviate 向量数据库中用 Python 生成摘要,运用所谓的“生成式反馈循环”概念
December 10, 2023
View Article最近,我一直忙于开发 Ollama,因此投入了大量时间研究如何在本地系统上运行大语言模型(大语言模型),并探索如何将它们封装进应用程序。一般而言,大部分桌面应用程序只要求用户输入 OpenAI API 密钥,或者从源代码编译 Python 项目即可集成大语言模型。尽管这些方法在理论上可行,但对于许多用户来说,它们的技术门槛仍然较高。我追求的是用户能够一键下载并立即运行的应用程序。
December 10, 2023
View Article虽然关于通过 OpenAI、Anthropic、Google 等公司的 API 调用 LLM 来构建应用的文章层出不穷,但我选择了一条不同的道路,尝试仅使用本地模型和技术来构建网页应用,尤其是那些能在浏览器中运行的技术!
December 10, 2023
View Article职业生涯就像是一个漫长的旅程,最难的地方在于你的目的地是未知的,甚至没有地图来指引你如何前行。
December 10, 2023
View Article本文汇集了许多来自 Netflix 工程团队的博客和开源项目的研究成果。如果您在阅读中发现任何不准确之处,请不吝告知。
December 10, 2023
View Article探讨如何结合传统关键词搜索与现代向量搜索来获得更相关的搜索结果
December 9, 2023
View Article目前,我主要的工作是兼任部分时间的 CTO 服务。坦白说,在进行创新的同时担任这个角色对我来说颇有挑战。同时兼顾这两者非常艰难,所以我暂时放下创新者的角色,专注于规划发展路线图和招聘事宜。招聘其实是一个挑战,需要精准识别不同职位和所需资源。
December 8, 2023
View Article在本文中,我会详细介绍如何打造你专属的 AI 旁白。文章末尾,我还会分享一些实用的代码。
December 8, 2023
View Article出于恐惧?我早就想分享这个故事了。
December 8, 2023
View ArticleOpenAI 还没具体说明 Q* 是什么,但已经透露了许多线索。
December 8, 2023
View Article从学术论文的理论到利用 OpenAI、Weaviate 和 LangChain 的 Python 应用实现
December 7, 2023
View Article如何通过这些“超参数”和调整策略优化你的检索增强生成(RAG)流程
December 7, 2023
View Article这篇博客的灵感完全来自 Andrej Karpathy 在 YouTube 上的视频“忙碌人士的大语言模型速览”。在我看来,这是对大语言模型的最精彩解释。对于更喜欢阅读而不是观看的朋友,这篇文章是你的理想之选。
December 7, 2023
View Article深入了解我们如何使用生成式 AI 模型进行创新实验,从而拓宽 GitHub Copilot 在开发者整个生命周期中的应用。
December 7, 2023
View ArticleClaude 2.1 在处理高达 20 万 Token 的庞大上下文时,检索特定句子的能力令人瞩目。我们通过实验发现,利用精心设计的提示技巧,可以引导 Claude 更准确地回忆出相关信息。
December 7, 2023
View Article“emoji”这个词与情绪并无直接关联。很多人误以为“emoji”一词源自“emotion”(情感),其实这只是个巧合。它实际上来自于日语中的“絵”(图片,发音 _eh_)加上“文字”(字母或字符,_mōji_)。简而言之,这个词指的是一种图画文字。尽管这个词本身与“情感”这个词在词源上并无关联,但我们使用 emoji 的方式却能深刻反映我们的自我特性以及我们如何与他人建立联系。
December 6, 2023
View Article很多离开谷歌的工程师表示,他们最怀念的内部工具之一是 Critique,谷歌的代码审查工具。探究谷歌的代码审查工具(Critique):AI 助力的创新与最新统计
December 6, 2023
View Article让 AI 更贴近每个人的生活
December 6, 2023
View Article新兴技能的出现催生了一个新职称:要掌握这些技能,我们需要超越简单的命令行编程,转而开发 软件。
December 6, 2023
View Article必须采用多模型战略,新兴 AI 基础设施的发展,以及大语言模型(LLM)作为新的抽象层次。
December 6, 2023
View Article在大语言模型应用阶段,重点是让回答变得非常具体,无论是针对数据集、用户、使用场景,还是特定的调用请求。
December 5, 2023
View Article提示工程、RAGs 与微调的对比是每位搭建基于大语言模型(LLM)应用的 AI 工程师都面临的关键选择。
December 5, 2023
View Article这里为您提供了一些建议和技巧,旨在提高大语言模型应用的精准度,并介绍了选择合适大语言模型的要点。
December 5, 2023
View Article未来,个性化的 AI 助手将可以在设备上离线运行,将衍生出很多出人意料的创新
December 5, 2023
View Article