退一步,看得更远:通过抽象引发大语言模型中的推理 [译]
我们为大家介绍了一个称为“退一步提示法(Step-Back Prompting)”的新技巧,能让语言模型通过抽象思考,从具体信息中找到核心观念和基础原理。凭借这些核心观念和原理,语言模型在逻辑推理上的表现得到了显著的提升。
October 26, 2023
View Article我们为大家介绍了一个称为“退一步提示法(Step-Back Prompting)”的新技巧,能让语言模型通过抽象思考,从具体信息中找到核心观念和基础原理。凭借这些核心观念和原理,语言模型在逻辑推理上的表现得到了显著的提升。
October 26, 2023
View Article改变我们生活方式的 200 项创新
October 25, 2023
View Article一种叫做 Zero-Shot-Context 的新方法,它可以在没有任何示例的情况下,自动提高翻译的质量。我们的实验结果显示,使用这种方法,GPT-3 的翻译效果得到了明显的提升,甚至可以与有示例提示的翻译相媲美。
October 25, 2023
View Article很多人苦于不知道如何写高质量的 Prompt,尤其是如果要用英文表达更是吃力,不容易表达准确。
October 24, 2023
View Article大语言模型偶尔会生成看似真实但实际上是错误的信息,这种情况被称为“幻觉”。我们研究了模型如何自我纠错。我们提出了一个名为“链式验证 (CoVe)”的方法:模型首先给出初步回答,然后制定问题来核实答案,并确保每个问题的回答不受其他回答的影响,最后输出经过核实的答案。实验结果显示,这种方法有效地减少了在不同任务中产生的误导性信息。
October 16, 2023
View Article以前,我们的机器学习模型一般都只处理一种类型的数据,比如只处理文本、图像或音频。但是,想想我们人类的大脑。我们不仅仅读写文字,还可以看图、看视频,听音乐,还能够辨识各种不同的声音。所以,为了让 AI 更接近真实世界,处理多种类型的数据显得非常重要。
October 15, 2023
View Article你想知道 ChatGPT 中 DALL-E 3 的系统提示词是什么吗?
October 15, 2023
View Article工作岗位虽然众多,但找到真正适合自己的位置依然困难重重。
October 12, 2023
View Article虽然作为开发者,我们总在追求技术上的进步,但同样重要的"软技能"也不能被忽略。我读了大约 40 本这样的书,现在想和你们分享一些最有价值的经验,帮助我们在技术和管理领域更上一层楼。
October 10, 2023
View Article虽然作为开发者,我们总在追求技术上的进步,但同样重要的"软技能"也不能被忽略。我读了大约 40 本这样的书,现在想和你们分享一些最有价值的经验,帮助我们在技术和管理领域更上一层楼。
October 10, 2023
View Article让 AI 直译的结果太生硬,意译又可能偏离原意,怎么办?
October 9, 2023
View Article想象下你是个中学校长,现在有一篇英文新闻要翻译给学生看,你有两个老师:一个英语老师精通英语,但是语文不太好,写出来的东西很生硬;一个语文老师精通中文,英文不太好,但是中文很好,写出来的东西流畅通俗易懂。
October 7, 2023
View ArticleAI 安全培训和大语言模型(LLMs)的红队实验是为了预防生成不安全内容。然而,我们发现,由于安全训练数据在不同语言之间的不平衡,这些安全机制在跨语言应用时存在脆弱性。我们证明,通过将危险的英语输入转换为使用率较低的语言,就可以成功规遍 GPT-4 的安全屏障。
October 6, 2023
View Article人类擅长借用已有的知识经验类比,用来推理解决新的问题。“类推提示法”则是借助大语言模型在训练过程中已经积累了丰富的解决问题的知识。通过明确指导 LLM 回忆或产生相关问题和答案,能帮助它们更好地学习和解决新问题。
October 5, 2023
View ArticleChatGPT 3.5 在指令识别上要比 GPT-4 弱很多,如果 Prompt 过于复杂,无法按照 Prompt 的要求执行,那么有没有办法也能让它能像 GPT-4 一样执行复杂的指令呢?
October 5, 2023
View Article“思维链”(CoT)提示法让语言模型在各类推理任务上表现优异,但是,这通常需要对推理过程的实例进行标记。在这个研究中,我们推出了一种新颖的提示技巧,名为“类推提示法”,旨在自动引领大语言模型进行推理。
October 3, 2023
View Article多模态大模型(LMMs)不仅拥有大语言模型(LLMs)的特点,还拓宽了其多感官技能,例如视觉理解,从而实现了更强的通用智能。本文深入探索并分析了最新的 GPT-4V(ision) 模型,旨在加深我们对 LMMs 的认识。我们的分析重点是 GPT-4V 能够完成的各种有趣任务,通过一系列精心设计的测试样本,来检验 GPT-4V 能力的质量和通用性,以及它所支持的输入和工作方式,还有有效启动模型的方法。在探索 GPT-4V 的过程中,我们整理了一系列涉及多个领域和任务的定性样本。这些样本的观察结果表明,GPT-4V 能够处理任意混合的多模态输入,并且其功能的通用性使其成为一个强大的多模态通用系统。此外,GPT-4V 独特的识别输入图像上绘制的视觉标记的能力,为发展新的人机交互方式,比如视觉参考提示,提供了可能。报告最后深入讨论了基于 GPT-4V 系统的新兴应用场景和未来研究方向。我们希望这一初步的探索能够启发未来关于多模态任务制定的下一代研究,发掘和强化 LMMs 以解决现实世界问题的新方法,以及对多模态基础模型有更深的理解。
October 2, 2023
View Article借助两轮翻译,让 ChatGPT 的翻译质量大幅提升,告别“机翻感”
September 28, 2023
View Article借助两轮翻译,让 ChatGPT 的翻译质量大幅提升,告别“机翻感”
September 22, 2023
View Article如何更好的格式化 JSON 输出?
September 1, 2023
View Article看起来你是在写程序,其实你做的是产品,那就不是简简单单的编程,无法像刷 Leetcode 那样,刷一刷就熟了,而是要面对软件工程中的各种问题。
August 22, 2023
View Article利用大语言模型(LLM)作为核心驱动的智能代理是一个极富创意的概念。有一些令人印象深刻的概念验证示例,比如 AutoGPT、GPT-Engineer 和 BabyAGI,都为我们展示了巨大的可能性。LLM 不仅可以创作流畅的文本、故事、散文和代码,更重要的是,它可以成为解决各种问题的强大工具。
July 23, 2023
View Article看到有人发《全网都在找的 GPT 最权威的 160 条指令》,其实没人记得住 160 条 Prompt,也没有必要去记 160 条 Prompt!
July 18, 2023
View Article这是一段能帮你给代码生成单元测试的提示词,针对 Claude 3,但理论上来说可以适用于绝大部分模型。
July 8, 2023
View Article领导说:“你们开发人员做了这么多年还等着主管给你们下发任务?”,领导这么说是不是不太符合软件工程管理?
June 24, 2023
View ArticleMLOps 本质上仍然是 DevOps,只是现在关注的是与 AI 和大语言模型相关的产品。
April 18, 2023
View Article近来,我频繁地探究如何高效地运用大语言模型 (LLM)。设想这样一个场景:你的老板对你说:“嘿,Finbarr,我们快破产了,因为我们把所有投资者的钱都花在了支持我们那个 300 亿参数、模仿 John Kenneth Galbraith 风格说唱的模型的 GPU 上。我们该怎么办?”
January 5, 2023
View Article既有亮点也有挑战 —— 并伴随着诸多炒作。伴随着假期的结束,我们满载热情回归,为大家带来 2024 年的最新观点!
January 5, 2023
View Article早些年开发软件,一个版本发布上线的时间周期是以“月”甚至“年”为单位计的,但是现在随着敏捷开发的推行和普及,版本上线的周期变成了“周”为单位,甚至更短。周期缩短,并不意味着要牺牲质量,而是一样会有完善的开发流程来保障质量,比如设计、开发、自动化测试和手工测试。但是当缩短开发周期的时候,可能原本运行好好的开发流程就会出问题,软件质量下降,需要去重新调整开发流程,以重新做到高效和稳定。
August 24, 2020
View Article我想也许你早就听说过“Deadline 是第一生产力”这句话,哪怕以前没听说过,我相信看完本文后,再也不会忘记这句话,甚至时不时还要感慨一句:“Deadline 是第一生产力!”。
June 29, 2020
View Article日常项目中涉及时间、成本和范围的问题,都离不开“软件项目管理金三角”的概念。掌握好这个知识点,学会平衡软件质量与时间成本范围的关系,可以帮助你更好的驾驭项目中的各种问题,也可以帮助你更好地理解软件工程中各个模型,尤其是瀑布模型和敏捷开发。
April 1, 2019
View Article软件工程就像一个国家的农业,是最基础的设施!
January 4, 2019
View Article记录一次实习生招聘的经历
November 15, 2018
View Article前不久,我们家两个小朋友沉迷于玩“我的世界”(MineCraft),考虑到堵不如疏,还是正面引导他们比较好,于是和孩子的妈妈商量后,给他两出了个题目:“把我们住的公寓在 MineCraft 里面搭出来”。为了激励他们,告诉他们如果 2 个月内搭好,还可以给他们奖励一个大乐高玩具。
June 16, 2016
View Article