MemGPT:将大语言模型转变为操作系统 [译]
大语言模型(LLM)已经在人工智能领域带来了革命性的变化。然而,它们的应用受限于处理信息的上下文窗口较小,这在执行长对话和文档分析等任务时尤其成问题。为了突破这一限制,我们提出了一种名为虚拟上下文管理的新技术。这种技术借鉴了传统操作系统中层次化内存系统的理念,能够通过在不同速度的内存间转移数据,从而扩展大语言模型处理信息的能力。基于这种技术,我们开发了 MemGPT(Memory-GPT),这是一个智能系统,它能够有效地在大语言模型本身有限的上下文窗口内提供更广泛的上下文信息。此外,MemGPT 还采用中断机制,以优化系统与用户间的交互控制流。我们在两个重要领域对这种受操作系统启发的设计进行了评估:一是文档分析,在这一领域,MemGPT 能够处理远超大语言模型本身上下文限制的庞大文档;二是多回合对话,在这里,MemGPT 能够构建出能够记忆、反思并在与用户长期互动中不断进化的对话智能体。
January 24, 2024
View Article