首页


大语言模型能取代编译器吗? [译]

我和 Kevlin Henney 最近讨论了一个问题:将来的自动代码生成工具,比如升级版的 GitHub Copilot,是否有可能取代现有的高级编程语言。我们具体想知道的是,ChatGPT N(N 很大)是否能跳过用高级语言编写代码的步骤,直接生成像今天的编译器那样的可执行机器代码?

January 12, 2024

View Article

专访:凯文·凯利,多面才子,未来学思想领袖 [译]

Elon Musk 是一个充满争议的人物。我的目的,如同往常,是为了在喧嚣、复杂或难以理解的话题中增添一些细致见解和清晰信号。不论你对 Elon 怎样看,我认为推动讨论走向更深入、更有意义的交流是非常有价值的,同时希望这不会给我带来太多风险。问题在于,市面上 99% 的批评都出于恶意且不准确,导致大多数人缺乏理解 Elon 行动动机和目的的必要背景。这是个问题,因为 Elon 是一位颇具影响力和远见的领导者,他的公司在传递变革性技术的过程中扮演着越来越重要的角色。

January 12, 2024

View Article

探究推理步骤长度对大语言模型的影响 [译]

在增强大型语言模型(LLMs)推理能力的过程中,“思维链”(Chain of Thought,简称 CoT)扮演着关键角色。但是,CoT 效果与其推理步骤的长度之间的具体联系还不太明确。为了弄清楚这一点,我们开展了一系列实证实验。我们的实验主要围绕在 CoT 示范中对推理步骤进行扩展或压缩,同时保证其他所有因素不变。我们的研究发现了几个重要点。首先,结果显示,即使不在提示信息中加入新内容,增加推理步骤也能显著提升 LLMs 在各种数据集上的推理表现。相反,减少推理步骤即便保留了核心信息,也会明显削弱模型的推理能力。这一点强调了 CoT 中推理步骤数量的重要性,并为在解决复杂问题时更有效地利用大语言模型提供了实用的指导。其次,我们还研究了 CoT 的效果与示范中使用的推理理由之间的关系。出乎意料的是,即便是错误的推理理由,只要保持了足够的推理步骤长度,也能取得不错的效果。最后,我们发现,增加推理步骤的益处取决于任务的性质:简单任务需要较少的推理步骤,而在处理更复杂的任务时,更长的推理过程则会带来显著的优势。

January 12, 2024

View Article

你唯一需要精通的事情 [译]

有一篇关于斯多葛主义的小文章,自我读过以后,对我的生活产生了深远的影响。可能是我成年之后第一次,我觉得自己没有浪费太多时间。我感觉自己已经做好了迎接挑战的准备。

January 12, 2024

View Article

哪些信号表明该离开公司寻找新的工作机会了... [译]

当公司停止发展,创始人离职,人事部门开始主导大局,或者高层更关心房产而非产品时...那就意味着,你该寻找新的工作机会了。

January 11, 2024

View Article

性能提升👆,复杂度降低👇:Shopify 工程部的重大革新 [译]

在 Shopify,追求技术卓越是我们的宗旨。我们始终致力于基础设施的完善,即便这些努力的成果不总是一目了然。我们经常通过简化系统来改进基础设施。这种持续的简化是创新的基础。为什么这么说呢?因为虽然并非所有快速软件都卓越,但所有卓越的软件一定是高效快速的。对我们的商户而言,每一毫秒都极为宝贵。这就意味着我们的系统不仅要易于扩展,还要避免复杂繁琐的架构。

January 11, 2024

View Article

通过在粘贴的文本中加入不可见指令,实现对大语言模型的提示注入 [译]

我重新审视了我此前的推文,关于这是近几周来最重要的提示注入发现。事实上,这是自提示注入出现以来最大的技术突破和安全挑战。

January 11, 2024

View Article

拥抱 Hugging Face:我们的初创公司并购幕后 [译]

2021 年末,我们这个遍布全球的五人工程师团队,签署了关闭我们初创公司 Gradio 的文件。对大多数创始人而言,这通常是一个伴随着悲伤或深刻反思的时刻。但我们却在庆祝。因为我们即将被 Hugging Face 收购!这次收购是我们辛勤努力的成果,但在几周时间里,一直被一位投资者所阻挠。我们对他施加的压力越大,他就越坚决不签署收购协议。然而出乎意料的是,这位投资者最终让步,使我们得以加入 Hugging Face。这是自从被收购以来,我首次详细记录这段经历。我希望这能够揭开初创企业被收购的神秘面纱,同时也展示创始人们为了提高成功被收购的几率可以做出哪些决策。

January 11, 2024

View Article

文本分割的五个层次 [译]

在这个教程中,我们将探讨文本分割的五个层次。这份非官方的列表是为了增添趣味和教育目的而编制的。是否曾尝试向 ChatGPT 输入长篇文本,却被告知内容过长?或者你在尝试改善应用程序的长期记忆能力,但似乎效果仍不理想。要提升语言模型应用的性能,一个非常有效的策略是将大型数据切分为小块。这个过程被称为分割或分块(这两个术语我们将交替使用)。在多模态领域中,这种分割同样适用于图像。我们将介绍很多内容,但如果你能坚持阅读到最后,我保证你将对分块理论、策略以及进一步学习的资源有一个全面的了解。

January 11, 2024

View Article

如何做出艰难的决策 [译]

做决策其实并不复杂。在大多数情况下,我们心里已经有答案。然后我们却花费几周时间来自我说服,认为这是最佳的选择。有时,我们甚至永远无法下定决心。我们为何如此自我折磨?1. 首先,是因为我们总认为做重要决策应该很困难。我们甚至可能希望它困难。因为如果我们花很长时间而不是短暂考虑后做出决策,最后却失败了,我们可以找到合理的借口 —— “但我已尽全力!”2. 其次,我们总是尽力寻找最佳方案。因为我们面临的风险非常大。这直接导致了一种被称为“分析瘫痪”的怪圈,我们在其中陷入漫长的迷茫。

January 11, 2024

View Article

为何你应该计划完成更少的任务 [译]

“计划谬误”是指我们在预测个人生产力时的自然偏差:我们倾向于着眼于最佳情景,或者非常接近的情况,但这种情况很少实现。

January 11, 2024

View Article

ChatGPT 在编程中的有效性:与其他流行大语言模型的比较分析 [译]

本研究旨在探究 OpenAI 的 ChatGPT 模型在编程任务中的有效性和效率,该模型基于 GPT-3.5 和 GPT-4 技术。研究目的是了解 ChatGPT 对编程和软件开发的潜在影响。我们采用定量方法,使用 Mostly Basic Python Problems (MBPP) 数据集来衡量这些模型的表现。研究不仅对 GPT-3.5 和 GPT-4 进行了直接评估,还包括了与 AI 领域其他知名大语言模型的比较,特别是 Google 的 Bard 和 Anthropic 的 Claude,以此衡量和比较它们在同样任务上的熟练程度。研究结果凸显了 ChatGPT 模型在编程任务上的优势,为 AI 社区,特别是开发者和研究人员提供了有价值的洞见。随着人工智能技术的广泛应用,本研究为 AI 辅助编程的发展提供了一份及时的参考。

January 11, 2024

View Article

执行大项目的精髓:目标定位、迅速行动、灵活调整 [译]

我登录了 StickK.com,一个创建承诺合约的平台,并在那里立下了一个挑战:我计划在未来 9 个月里完成一部小说,并在年底前交给我的文学代理人审阅。我不仅与我的朋友们分享了这一承诺,还在包括 10 万播客听众在内的多个公共场合公开讨论了这一计划。这个挑战的风险有多大?如果我没能完成,我就要向一个我并不支持的所谓“反慈善”组织捐赠 9999 美元,这是 StickK 平台允许的最高金额。剧透一下:我最终成功了,在年底前的最后一小时,我几乎耗尽了所有精力。在完成初稿之后,我甚至抽出一天时间,利用 AI 制作了一部小说预告片。但重要的是,尽管我对这个挑战充满信心,当我签订这个合约时,却根本无法确定能否成功:近 10 年来,我几乎未曾涉足小说创作。虽然我写作能力不错,但历来写作速度不快。我还需要管理一家需要大量时间和精力的公司。那么,我是怎样坚信自己能够完成这个挑战的呢?

January 10, 2024

View Article

给年轻人的忠告,我对自己的自欺 [译]

我并不认为自己有资格给出建议。但许多人在 Twitter 上私信我,询问我的想法,所以我写下了这些话。这样,我就不需要反复回答相同的问题了。编辑这篇文章的过程中,我发现我实际上是在为我年轻的妹妹 Katherine 分享我的经验。

January 10, 2024

View Article

比尔·盖茨–1986 [译]

Elon Musk 是一个充满争议的人物。我的目的,如同往常,是为了在喧嚣、复杂或难以理解的话题中增添一些细致见解和清晰信号。不论你对 Elon 怎样看,我认为推动讨论走向更深入、更有意义的交流是非常有价值的,同时希望这不会给我带来太多风险。问题在于,市面上 99% 的批评都出于恶意且不准确,导致大多数人缺乏理解 Elon 行动动机和目的的必要背景。这是个问题,因为 Elon 是一位颇具影响力和远见的领导者,他的公司在传递变革性技术的过程中扮演着越来越重要的角色。

January 9, 2024

View Article

即使在理想情况下,信用卡诈骗也是会存在的 [译]

近日,我接受了 NPR 的 Planet Money (播客,文字记录) 的采访,讨论信用卡诈骗的一个特别形式。有个观点未能播出,那就是:“理想情况下,诈骗的存在不应为零。”这个说法听起来可能有些违反直觉,甚至显得有些矫情。但实际上,这是一个值得信赖的观点。

January 9, 2024

View Article

你需要的不仅是韧性,更需要朋友和金钱 [译]

许多商业书籍强调培育心理韧性来应对困境,却忽视了更重要的因素。韧性已成为一门盛行的生意。机场书店充斥着各种关于“为何有人能成功而他人却失败”的书籍,或承诺教你培养“无敌的心理韧性”。TED 演讲、播客和社交媒体上充满了介绍韧性人士的三至五个特点,如乐观、坚韧和成长心态。随着管理界认识到成功背后往往隐藏着无数次的失败,关于如何从失败中恢复的建议也应运而生,这些建议通常源自精英军事部队或极限运动员的经验。作为管理思维领域近 20 年的从业者,我编辑和采访过许多这样的影响者。然而,这些良好意图的建议者却给人留下了两个误解:首先,认为韧性很罕见;其次,认为韧性几乎完全来自内心。事实上,这两点都不正确。

January 9, 2024

View Article

在 Go 语言 14 年的发展历史中,我们做得对的和不对的 [译]

这是我在 2023 年 11 月 10 日,也就是 Go 作为开源项目发布 14 周年之际,在悉尼 GopherConAU 会议上所做的闭幕演讲。演讲中穿插使用了一些演示文稿的幻灯片。

January 9, 2024

View Article

在工程行业中质疑直觉的重要性 [译]

我经常听人说,应该依据第一直觉来做决策。但在我们这个行业,这种做法未必总是最佳选择。工程决策绝不能仅仅基于直觉,因为这太主观了。我们必须依赖事实,客观地做出判断。让我们深入探讨一下。

January 8, 2024

View Article

整合人工智能的两大策略 [译]

人工智能(AI)预计将彻底改变我们的工作方式,为首批采用者带来显著的竞争优势。许多公司已经开始使用 AI 驱动的自动聊天机器人来处理客户咨询,但仍有些公司对这种新兴技术不够熟悉。这里面的关键问题是:这些应用中的 AI 效果如何?目前,像 ChatGPT 或 Google 这样的开放式大型语言模型(LLM)面临的一个挑战是对实时数据的访问受限。虽然有像 Bing 插件这样的例外,但即便如此,直接从自己网站上提取数据也不容易。不通过昂贵的模型微调就克服这个限制是个大挑战。而检索增强生成(Retrieval-Augmented Generation,RAG)技术或许能提供解决方案。

January 8, 2024

View Article

Spotify 如何通过自动化内容营销在全球范围内扩大用户群 [译]

虽然构建成功的软件架构的过程看似简单,实际上却颇具挑战。要理解 QARs,并在此基础上做出最优权衡,需要深刻的洞察力和丰富的经验,而这些往往需要通过对架构本身的不断试验和调整来积累。虽然过程本质上不复杂,但所涉及的权衡决策通常充满挑战,而且难以找到简单的解决方案。

January 8, 2024

View Article

关于 Viberary 的回顾 [译]

Viberary 是我创立的一个副项目,旨在通过氛围来查找书籍。我创建这个项目,一方面是为了满足自己进行机器学习侧项目的兴趣,另一方面是为了探索当前搜索和推荐技术的界限。这个项目不仅是对我最近在嵌入技术方面深入研究的一个补充,而且是一个符合生产级标准的实践。虽然这个项目很有趣,但它也确切地证实了我一直以来对自己的理解:达到 MLE(机器学习启蒙)是一个循环过程,涉及建模、工程和 UI 设计等多个方面,并将这些方面紧密结合在一起 - 将系统投入生产就是最终的奖赏。和任何生产级系统一样,机器学习并非魔法,即使数据输出不是确定性的,构建这类系统也需要精心的工程和设计选择。我认为,这是当前机器学习领域中常被忽视的一个方面。通过这篇文章,我不仅想要回顾我所做的工作,还想概述一下搭建一个基于 Transformer 的机器学习应用所需的一切,哪怕是一个小型的、使用预训练模型的应用,我希望这篇文章能成为一个有用的资源和参考。Viberary 的机器学习架构是一个基于双塔模型的语义检索系统。它使用 Sentence Transformers 预训练的不对称 MSMarco 模型对用户的搜索查询和 Goodreads 书籍数据库进行编码。

January 8, 2024

View Article

LlamaIndex 数据摄入管道 [译]

LlamaIndex 的数据摄入管道是一种全新且改进的方法,用于高效摄入和管理数据文档。这一管道特别适用于需要将输入文档经过一系列处理步骤(如切分、嵌入等)后才进行索引建立的情况,比如我们的 RAG 管道就是这样。此外,它还具备缓存、文档存储管理、向量存储更新等实用功能。

January 8, 2024

View Article

6 个残酷真相,让你成为更好的人 [译]

如果你的职业生涯进展顺利,对生活感到满意,人际关系也很和谐,那么你可以不用阅读这篇文章。请享受你美好的一天,朋友,这篇文章可能不适合你。你做得很出色,我们都为你感到骄傲。为了不让你觉得白费了一次点击,这里有一张 Lenny Kravitz 戴着超大围巾的照片。

January 8, 2024

View Article

昨夜,麻省理工学院 (MIT) 无人安然入眠 [译]

就在昨晚我宣布将对所有现任 MIT 教员进行剽窃审查之后不久,我确信 Kornbluth 校长、MIT 行政团队和董事会成员们能听到校园内集体传来的哀叹声。为什么这样?原因很简单:每位教员都清楚,一旦他们的研究成果被 AI 盯上,学术界的任何文献都难以逃过 AI 的发言,检测引号缺失、改写不当或未能适当引用他人工作等问题将无所遁形。但昨晚不仅是 MIT 的教员失眠,哈佛大学的教员们、其董事会成员和行政领导也同样辗转反侧。因为,我们为什么要止步于 MIT?难道我们不应该同样深入调查哈佛大学的学术诚信吗?耶鲁、普林斯顿、斯坦福、宾夕法尼亚、达特茅斯怎么办?意思你的明白?

January 7, 2024

View Article

生成式 AI 面临的抄袭问题 —— Midjourney 和 DALL-E 3 的实验揭示了版权方面的难题 [译]

长久以来,人们一直在探讨大语言模型 (LLMs) 在何种程度上可能会“记住”其训练数据的问题。包括 Google DeepMind 的 Nicholas Carlini 和本文的第一作者 Gary Marcus 在内的学者都曾对此提出疑问。最新的实证研究显示,在某些情况下,LLMs 能够原样复制或稍作修改后复制其训练集中的大量文本。例如,Milad Nasr 及其团队在 2023 年的论文 中指出,LLMs 可以被激发,泄露如电邮地址和电话号码等私人信息。Carlini 和他的合作伙伴 最近的研究 也显示,较大的聊天机器人模型(而非小型模型)有时会逐字复制其训练集中的大量文本。

January 7, 2024

View Article

研究表明,依靠意志力改掉坏习惯是徒劳无功的 [译]

研究显示,单靠意志力戒掉坏习惯是徒劳无功的。我们需要找到不必依赖坚强意志的策略。

January 7, 2024

View Article

2024 年人工智能在职场发展的五大趋势 [译]

今年,人工智能在招聘偏见、包容性、监管等多个领域的影响将更加显著。就像 2023 年成为人工智能的转折点一样,2024 年人工智能预计将产生更深远的影响。这一次,工作者们已做好准备迎接挑战。随着生成式 AI (Generative AI) 已经成为员工关注的焦点超过一年,他们不仅更加理解其在当今工作环境中的作用,而且也准备好拥抱随之而来的变化和机遇。现在是利用这一优势的时候了。为了保持领先,工作者们需要了解即将出现的 AI 领域的这五大趋势。

January 7, 2024

View Article

专注与心流:程序员生产力的权衡 [译]

程序员对提升生产力的方法论兴趣浓厚 —— 如何更准确地估计任务、用更少的时间完成更多工作,以及提高工作质量。我也深入研究了这一领域。在阅读了大量书籍后,我发现了一些可能对其他软件开发者有用的有趣见解。

January 6, 2024

View Article

Chess-GPT 的内部世界模型 [译]

在机器学习 (ML) 的众多近期进展中,有两个特别吸引我的。第一个是 gpt-3.5-turbo-instruct 在国际象棋中达到 1800 ELO 水平。一个大语言模型 (LLM) 能够仅凭网络上随机抓取的文本就学会下好棋,这似乎不可思议。第二个是 Kenneth Li 的论文《生成世界表示》。The Gradient 上有一篇精彩的摘要,以及 Neel Nanda 的后续分析。他们训练了一个含有 2500 万参数的 GPT,用于预测奥赛罗游戏中的下一步棋。它不仅能在训练数据集未覆盖的游戏中准确落子,而且通过线性和非线性的探测发现,这个模型能准确追踪棋盘的状态。然而,这一成果仅限于使用奥赛罗游戏树上均匀采样得到的合成数据集训练的模型。当他们尝试将相同的技术应用于使用人类对弈数据训练的模型时,结果并不理想。在我看来,这是该论文发现的一个重要限制,可能会影响其在现实世界的应用性。比如,我们无法仅通过从代码树均匀采样来生成代码。因此,我对此进行了深入研究。我训练了一些国际象棋游戏模型,并对这些训练好的模型进行了线性探测。我的研究结果非常正面,解答了我之前的所有疑问(当然,这也带来了更多新的问题)。

January 6, 2024

View Article

书评:Elon Musk [译]

这不是大家现在热议的那本 Musk 新传记,而是 Ashlee Vance 在 2015 年写的 Musk 传记。我在 7 月份开始阅读它,那时还不知道有新出的一本。不过没关系:Musk 一如既往,始终如一。我阅读这本书,是想弄明白他究竟是个什么样的人。Musk 就是一个谜团。他引领着世界上最先进的火箭的制造,显示出他的聪明才智。作为世界上最富有的人,他显然拥有出色的商业决策能力。然而,这位聪明、商业决策出众的人物,却不时做出看似愚蠢的商业举动。他无谓地与监管机构争执,提起注定失败的无效诉讼,虐待关键员工,甚至给全球知名的品牌重新命名。

January 6, 2024

View Article

知识工具:从有限到无限 [译]

一座庞大的图书馆就像是一个奇妙的伪无限世界,覆盖了成百上千的主题,汇集了无数作者的声音。好的图书馆能够在有限的空间里营造出一种感觉:即便你花费几个世纪去阅读,也无法完全掌握其内部蕴含的知识。这不仅是因为书籍众多,更因为当你通过一本书的视角去解读其他书籍时,总有新的学问等着你去发掘。这就像是用有限的积木搭建起无限的宇宙。

January 6, 2024

View Article

木龙年,机会正等待那些勇往直前的人 [译]

作为 Kapwing 的全职软件工程师,同时也是一位不断在世界各地漫游的数字游民,我领悟到了许多如何拥抱这种生活方式的诀窍。记得几年前的一个工作日午后,我家的门突然响了。来人是 Bill,我们农场的一名员工。“你猜怎么着,一头我们都没注意到怀孕了的牛突然生了小牛,”他兴奋地告诉我,“我们准备用你的名字给小牛命名。”对于一个牧场主来说,这或许是平常不过的一天。但我,其实并非牧场主。我是一名全职软件工程师,同时自 2020 年起,我还踏上了数字游民的生活旅程。

January 6, 2024

View Article

编程与写作 [译]

一年前,我暂停了编程生涯,开始尝试写小说,曾以为这是与编程截然不同的新旅程。然而,经过无数次的写作和反复修改,我现在深信两者其实有着诸多相似之处:无论是开发大型系统还是撰写小说,它们都有许多共通之处和类似的过程。这两种活动最明显的相似之处在于,不管是编程还是写作,你都在创作文字。尽管代码不同于自然语言写就的散文,它同样遵循着一套固定的规则(即语法),某些代码形式对大多数程序员来说颇为自然,而其他的即便形式正确,也可能难以理解。然而,编程和写作之间有更深层的联系:一个出色的程序和一本精彩的小说都是由各自的局部元素和整体构成精心编织而成。优秀的代码不仅要求每一条语句都写得清晰易懂,而且整个程序的不同部分需要保持独立性,设计上协调一致,互动清晰。同样,一本好的小说在字句的精准与整体结构和章节间的关系上也同样重要。

January 6, 2024

View Article

React 服务组件:优点、缺点与不足之处 [译]

React 服务组件 为 React 引入了专属于服务端的强大功能。我在 Next.js 13 和 14 的应用中实践了这一新范式,接下来是我对其的真实评价。之前我一直在犹豫是否要发表这篇文章,因为 React 社区过去对待批评的态度让我有所顾虑。但最近,我认为分享我的看法变得尤为重要,特别是在我发现大多数现有批评要么记录不充分,要么基于对此技术的不熟悉。写下这篇文章,我是站在一个非常重视用户体验的角度。虽然我也关注开发者的体验,但我始终认为用户体验是最重要的。

January 6, 2024

View Article

规模的根本力量 [译]

这些力量让大型公司变得反应迟缓且难以操作,但如果能妥善利用,它们同样可以发挥巨大效果。

January 5, 2024

View Article

只要运用得当,电商与人工智能就是完美搭档 [译]

随着感恩节创下的 56 亿美元在线销售记录预示着电商的新纪元,也凸显了企业亟需采纳如人工智能这样的先进技术。

January 5, 2024

View Article

为何糟糕的科研代码胜过严格遵循编程规范的代码 [译]

我刚读了一篇名为“科学代码的低质量”的文章,作者认为科学家编写的代码质量不如涉及到“软件工程师”的情况。在过去的十多年里,我一直在一个以数学或物理背景人士为主的环境中工作,这里的人对“软件工程”的了解相对有限。

January 5, 2024

View Article

软件工程师的公开演讲指南 [译]

“你的技术水平已经很不错了,但你还需要在沟通方面加强。” - 你的经理。对于软件工程师来说,这可能是最难以接受的反馈之一。为什么呢?因为你可能认为作为软件工程师,只需要擅长编程语言就足够了。但事实并非如此。单纯专注于编程可能会限制你的成长和晋升空间。

January 5, 2024

View Article

构建高级 RAG 的指南和技巧 [译]

这是一份全面的 RAG 指南,详细阐述了采用 RAG 的动机,以及如何超越基础或初级 RAG 构建的技术和策略。

January 5, 2024

View Article

大语言模型与大脑的相似之处与不同之处 [译]

在许多关于大语言模型是否构成“人工智能”或“通用人工智能”(AGI)的讨论背后,潜藏着一些关于这些系统与人类大脑相似或不相似程度的假设。支持者倾向于认为,从计算规模和复杂性上来看,这些模型与大脑作为信息处理系统的关键特性相匹配。而怀疑者则常将大语言模型(LLM)视为“高级自动纠错工具”,并否认这些系统在类似大脑方面(或能展现出“智能”,不论定义如何)有任何实质意义。实际的答案可能介于两者之间。

January 5, 2024

View Article

Mobile ALOHA: 利用低成本全身远程操作系统学习复杂的双手移动操作技能 [译]

在机器人技术领域,通过模仿人类的动作来训练机器人(模仿学习)已经取得了显著的成果。然而,这些成果大多集中在桌面操作上,而缺乏在更广泛实用任务中所需的移动性和灵活性。在本研究中,我们开发了一个模仿复杂移动操作任务的系统,这些任务需要双手操作和全身协调。首先,我们推出了 Mobile ALOHA,这是一个用于数据收集的低成本、全身远程操作系统。它在原有 ALOHA 系统的基础上增加了移动底座和全身操作界面。利用 Mobile ALOHA 收集的数据,我们进行了监督式学习(即模仿并复制行为),发现将其与现有静态 ALOHA 数据集结合训练可以显著提高处理移动操作任务的能力。例如,通过对每项任务进行 50 次模仿演示,结合训练可以使任务完成的成功率高达 90%,让 Mobile ALOHA 能够自主完成一系列复杂的移动操作任务。这些任务包括煎炒虾并将其盛盘,打开双门壁橱存放重型厨具,呼叫并进入电梯,以及用厨房水龙头轻轻清洗使用过的平底锅。

January 5, 2024

View Article

2024 年开发者生产力新动向:新指标及更多生成式 AI 的应用 [译]

当我们回顾过去一年,我们的视角转向 2024 年开发者生产力的发展趋势,这包括平台工程的创新、AI 的辅助作用以及对这些因素的量化评估。

January 5, 2024

View Article

数字游民三年记:我如何成为一名全职“漂流者” [译]

作为 Kapwing 的全职软件工程师,同时也是一位不断在世界各地漫游的数字游民,我领悟到了许多如何拥抱这种生活方式的诀窍。记得几年前的一个工作日午后,我家的门突然响了。来人是 Bill,我们农场的一名员工。“你猜怎么着,一头我们都没注意到怀孕了的牛突然生了小牛,”他兴奋地告诉我,“我们准备用你的名字给小牛命名。”对于一个牧场主来说,这或许是平常不过的一天。但我,其实并非牧场主。我是一名全职软件工程师,同时自 2020 年起,我还踏上了数字游民的生活旅程。

January 5, 2024

View Article

Apple PASCAL 语法海报:极客圈的传奇作品 [译]

计算机历史中充满了各种对立,但 Apple 公司的历史尤为显著。创意与技术思维之间永无止境的碰撞孕育了许多令人难以置信的产品,这个故事正是源于对形式美与实用性的不同偏好之争。此故事的主人公非常杰出:我们说的是 Apple Macintosh 的两大创始人,乔布斯和 Jef Raskin。故事发生在 1979 年:就在几年前 Apple II 发布。那是 Apple 公司历史上的辉煌时刻,乔布斯身边聚集了一群杰出的头脑,现代计算机学的大幕正在拉开。

January 5, 2024

View Article

苹果 Pascal“语法”海报的历史,1979-80 [译]

自从几年前我在 Slashdot 发布了这篇文章,这个页面成了一个互联网的讨论热点,话题涵盖了从“你心目中的理想极客海报是什么?”到杰夫·拉斯金和史蒂夫·乔布斯这两位苹果麦金塔之父之间复杂关系的探讨。这个项目吸引人的地方在于,它不仅是史蒂夫·乔布斯和杰夫·拉斯金这两位杰出人物合作的实际成果……而且还反映了他们观点的不同。除了麦金塔电脑,如今能看到的这类成果寥寥无几。对于已故的杰夫·拉斯金亲自参与编辑、明确内容并与我共同创作这篇文章,我深感荣幸。

January 5, 2024

View Article

在 DEI 中重新思考种族主义和反种族主义的概念 [译]

在今天的新闻背景下,我想退一步,从更广阔的视角来探讨这个话题的真正含义。我最初对哈佛大学感到关切是在 10 月 8 日清晨,那时以色列尚未在加沙采取任何军事行动,却有 34 个哈佛学生组织公开支持哈马斯(Hamas),一个被全球认定的恐怖组织。他们单方面指责以色列对哈马斯的残暴行径负有全部责任。我不禁思考,这是怎么回事?

January 4, 2024

View Article

谢谢,过去的我 [译]

过去的我记录下的内容,为未来的我带来了好处。现在的我也需要继续这种良好的习惯。在我作为软件开发人员加入最近的一个 Ruby on Rails 项目后,我想在着手更有挑战性的工作前,快速实现一些容易达成的小成就。因此,我决定对客户的网页应用程序进行一次“技术检查”。我之前在其他 Rails 项目上也做过类似的工作,但那已经是许多年前的事了。我甚至几乎记不起上周我编写的代码内容,更别提那时制定的一系列检查步骤了。幸运的是,过去的我曾有远见地在前雇主的博客上发表了一篇文章:Profile Your Future App,详细记录了当时的思考步骤。尽管这篇文章的部分内容已随时间略显过时,特别是一些提及的外部服务(考虑到科技的不断变化,这并不令人意外),但我依然能够利用文章中的大部分内容来提高我目前工作的应用程序质量,而无需重复发明已有的轮子(也许其他网页开发人员也能从中受益)。所以,谢谢过去的我,你做得很好!你在解决问题的过程中进行了记录,这些记录为未来带来了益处:一个有价值、可复制的过程,任何人都可以为自己做到。

January 4, 2024

View Article

我使用的双语字幕文件格式,以及如何将字幕嵌入视频

经常有朋友问我字幕文件格式是什么?以及我是如何生成字幕视频的?

January 4, 2024

View Article

AI 并非你的职场竞争对手 [译]

在大语言模型和生成式 AI 盛行的时代,技能为何仍至关重要。我的一个朋友对学习 Python 编程语言犹豫不决,他问道:“几年后 ChatGPT 不是可以直接帮你编写程序吗?”。这种想法暗示着 AI 将会取代软件工程师,从而让技术技能变得无关紧要。还有人担心新兴的 AI 模型可能会破解现在广泛使用的加密技术。相比工程师们,作家和演员等创意行业的人士似乎更加忧虑。本文旨在消除这些误解,降低对这些新技术的过度炒作,并在讨论中引入理性思考。它是为那些在过去的技术浪潮中游刃有余,且日常工作中极度依赖其不可替代的人类特质的专业人士所写。AI 已经成为公众焦点。投资如潮水般涌入,新产品层出不穷。我们正处于一个技术炒作的高峰期。尽管有人担忧失业或世界末日,我将阐明为何 AI 不会威胁你的工作,并解释为什么你应该积极利用这些工具。

January 4, 2024

View Article