蔡崇信谈为什么阿里巴巴全力投入 AI [译]
这是今年五月蔡崇信在 2024 年摩根大通全球中国峰会期间炉边会谈的视频。在与关金星的 30 分钟对话中,蔡崇信概述了人工智能如何推动他 25 年前共同创立的公司在核心电商业务或云部门的增长。
June 23, 2024
View Article这是今年五月蔡崇信在 2024 年摩根大通全球中国峰会期间炉边会谈的视频。在与关金星的 30 分钟对话中,蔡崇信概述了人工智能如何推动他 25 年前共同创立的公司在核心电商业务或云部门的增长。
June 23, 2024
View ArticleAI 视频生成模型在制作引人入胜和复杂视频方面还有很长的路要走,但 HeyGen 团队正在通过使用语言、视频和语音模型来简化视频制作过程,从而创建包含个性化头像、插图(b-roll)和对话的视频。本周在“No Priors”节目中,HeyGen 的联合创始人兼 CEO Joshua Xu 加入了 Sarah 和 Elad 的讨论,介绍 HeyGen 团队如何分解视频的各个元素,并为每个元素构建或找到相应的模型,这些 AI 视频的商业应用,以及他们如何防范深度伪造(deep fakes)。
June 23, 2024
View ArticleThe new Siri vs the RabbitR1 and Humane pin
June 22, 2024
View Article在 Character.AI,我们正朝着通用人工智能 (AGI) 的目标迈进。在未来,大语言模型 (LLMs) 将会增强我们的日常生活,不仅提高商业生产力和娱乐效果,还能在教育、教练、支持、头脑风暴、创意写作等方面提供帮助。要在全球实现这一愿景,关键在于实现高效的“推理”,即 LLM 生成回复的过程。作为一家全栈 AI 公司,Character.AI 从头开始设计其模型架构、推理架构和产品,创造了独特的机会来优化推理,使其更高效、更具成本效益,并能扩展以满足快速增长的全球用户需求。
June 21, 2024
View Article毫无疑问,人工智能 (AI) 将对工作产生影响。但是,哪些工作更有可能被 AI 替代?哪些工作现在已经在被 AI 替代?为了找到答案,我决定查看实实在在的数据:从 2022 年 11 月 1 日(ChatGPT 发布前一个月)到 2024 年 2 月 14 日,Upwork 上的实际自由职业工作数据,看看哪些工作受到了最大的负面影响。
June 21, 2024
View Article达特茅斯工程学院与校友、OpenAI 首席技术官 Mira Murati Th'12 举行了一场独家对话。她讨论了 ChatGPT 和 DALL·E 背后的人工智能(AI),以及正在进行的安全和伦理考量及未来的影响。
June 21, 2024
View Article黃仁勳旋風席捲台灣 方念華獨家專訪!Exclusive Interview with NVIDIA CEO Jensen Huang 20240616 (完整版)
June 19, 2024
View Article我叫 Yufeng,我在 Google 担任工程师。我对设计提示词感兴趣的最初动机是因为从语言模型中获取有用的回应需要花费大量时间。有时候,我们甚至在不使用 AI 的情况下也能更快地完成工作。我希望能使我们的工具更加高效,而不是效率更低。我很高兴能帮助你更深入地了解如何设计有效的提示词。
June 19, 2024
View Article当你需要更精准的控制 LLM 的输出结果和定义其执行逻辑时,该怎么做?
June 15, 2024
View Article使用 ChatGPT 的 @ 功能,可以快速找到你用过的 GPT,或者根据关键字检索到,然后再输入你要它完成的任务,和你单独打开 GPT 输入效果是一样的。
June 14, 2024
View Article从我二十多年前参加高考以来,每年高考一结束,#计算机专业还值得报考吗# 就一直热门话题,一些人认为计算机发展了这么多年已经饱和,可能面临毕业即失业的风险,而另一些人则认为计算机专业依然是未来的热门专业,就业前景广阔。
June 13, 2024
View Article从一段翻译 Prompt 说起。
June 13, 2024
View Article在 2024 年全球开发者大会上,我们向大家展示了苹果智能系统,这是一套深度融入 iOS 18、iPadOS 18 及 macOS Sequoia 的个人智能体系。这一系统集成了多个功能强大的生成式 AI,专为处理用户日常需求而设计,能够根据用户当前的活动实时调整。苹果智能中的基础模型经过专门微调,以优化各种用户体验,如文本编写、通知的排序与摘要、为家庭及朋友对话创造有趣的图像,以及简化应用间的交互操作。
June 11, 2024
View Article利用 Ragas, TruLens 和 DeepEval 对一年级阅读理解练习进行上下文相关性评估的案例研究
June 11, 2024
View Article虽然这篇文章的标题称其为“最佳论文”,但实际上并非如此。我的目标是探索一篇真正的最佳论文应具备的特质。
June 11, 2024
View Article现在是使用大语言模型 (LLMs) 构建产品的激动人心的时刻。在过去的一年中,LLMs 的表现已经“足够好”可以应用于现实世界。LLMs 改进的速度,加上社交媒体上的大量演示,将推动预计到 2025 年 AI 投资达到 2000 亿美元。LLMs 的广泛可用性,让每个人,而不仅仅是机器学习工程师和科学家,都能在他们的产品中构建智能。虽然构建 AI 产品的门槛已经降低,但要创建那些不仅仅是演示效果好的产品,仍然充满挑战。
June 9, 2024
View Article如何测试 Chrome 内置的 Gemini Nano 大语言模型
June 8, 2024
View Article我有校对好的视频文稿,但是 Whisper 生成的字幕有错误,我该如何用文稿纠正字幕错误?
June 7, 2024
View Article我用文字描述的方式请教 copilot 指导我写 R 代码(科研作图用),但效果不好。与此同时我查到一现成的完美代码,但因为看不懂,无法根据实际情况调整,所以也无法复现。这个时候我想让 copilot 帮我协调一下,即用现成的代码基础上根据我的说明进行调整,promote 我应该一次性说清楚,还是分多次?
June 7, 2024
View Article我们将介绍提示词注入的工作原理、常见类型以及潜在的风险和后果。你将了解提示词注入如何使得系统生成错误信息、编写恶意软件,甚至可能导致数据泄露和系统远程接管。视频还会探讨应对提示词注入的多种方法,包括数据审查、最小权限原则、人类反馈强化学习等。
June 5, 2024
View Article在计算、网络和图形的发展历史上,Nvidia 有许多独特之处。此刻,它拥有大量资金,并且凭借其架构、工程和供应链在生成式 AI (generative AI) 市场中占据了领先地位,使其能够随心所欲地制定任何可能带来进展的路线图。
June 4, 2024
View Article运营大语言模型应用程序提出了一些在运营传统软件系统时熟悉的问题,但通常有新的变化来保持新鲜感。大语言模型应用程序还提出了全新的问题。我们将这些问题及其答案分为四部分:数据、模型、产品和团队。
June 4, 2024
View Article看到微博上一位医生这条被 ChatGPT-4o 坑的微博,尝试从技术角度解读一下,这样也许能更好的理解现阶段大语言模型的优缺点,在实际应用中能扬长避短。
June 2, 2024
View Article现在是使用大语言模型 (LLMs) 构建产品的激动人心的时刻。在过去的一年中,LLMs 的表现已经“足够好”可以应用于现实世界。LLMs 改进的速度,加上社交媒体上的大量演示,将推动预计到 2025 年 AI 投资达到 2000 亿美元。LLMs 的广泛可用性,让每个人,而不仅仅是机器学习工程师和科学家,都能在他们的产品中构建智能。虽然构建 AI 产品的门槛已经降低,但要创建那些不仅仅是演示效果好的产品,仍然充满挑战。
May 30, 2024
View Article探索你一直渴望了解的谷歌算法的秘密。
May 29, 2024
View Article2024 年 5 月 5 日,我收到一封电子邮件,发件人称得到谷歌搜索部门大量泄漏的 API 文档集的访问权限。邮件还提到,这些泄露文件已经得到前谷歌员工的验证,证实其真实性,并且这些前员工及其他人还透露了更多关于谷歌搜索操作的秘密信息。
May 28, 2024
View Article今天,我们在理解 AI 模型内部机制方面取得了重大突破。我们已经识别出数百万个概念在 Claude Sonnet(一种我们部署的大语言模型)中的表示方式。这是首次对现代生产级大语言模型的内部进行详细研究。这一发现有助于未来提升 AI 模型的安全性。
May 21, 2024
View Article利用开源的大语言模型 (LLM) 和 DSPy 技术来缓解提示注入问题,我们开发了迄今为止最先进的 AI 电子商务聊天机器人,使 OnlyFans 网红的收入提高了 2-5 倍。
May 18, 2024
View ArticleGPT-4o(“o”代表“omni 全方位”)能够实时处理音频、视觉和文本信息,使人机交互更加自然流畅。这款模型支持多种输入(文本、音频、图像)和输出(文本、音频、图像)模式,其响应音频的速度极快,最快可达 232 毫秒,平均响应时间为 320 毫秒,与人类在对话中的反应速度相当。无论是处理英语文本还是代码,GPT-4o 的表现堪比 GPT-4 Turbo,而在处理非英语文本方面则有了显著提升,同时运行速度更快,API 成本也减少了 50%。特别是在视觉和音频理解方面,GPT-4o 表现远超以往模型。
May 14, 2024
View ArticleIsomorphic 实验室和谷歌 DeepMind 共同开发的最新 AI 模型 AlphaFold 3,能够准确预测蛋白质、DNA、RNA 及配体等生命分子的结构及其相互作用,我们期待这一成果将深刻变革我们对生物世界与药物开发的理解。
May 8, 2024
View Article欢迎加入我们,深入探讨从基础到高级的 10 级 ChatGPT 提示工程技术。从基本的提示格式入手,逐步学习使用角色化技术,再进一步掌握如思维链 (Chain of Thought, CoT) 等更复杂的技术。在目前的工作中,我努力最大限度地提高从 GPT-4 及其他大语言模型 (Large Language Models, LLMs) 获取的准确性和实用性。我已经投入了数十小时研究学术论文和数百小时的模型提示实践,这个视频是我将这些经验压缩成 9 分钟分享的尝试。希望这个视频能为你带来启发。如果你有任何疑问,欢迎在评论区留言,我会确保回答你的问题!
May 6, 2024
View Article深度探索我在驾驭大语言模型(LLMs)中学到的策略
May 6, 2024
View ArticleSam Altman 在与斯坦福大学兼职讲师拉维 - 贝拉尼(Ravi Belani)的对话中,阿尔特曼为有抱负的人工智能创业者提供了建议,并分享了他对人工智能工具和人工通用智能的机遇与风险的见解。
May 3, 2024
View Article大语言模型的接口:大语言模型广受欢迎的一个重要原因在于,其文本到文本的接口极其简单,用户可以轻松使用。在早期,使用深度学习解决一个任务通常需要对模型进行微调,通过数据训练使其掌握解决该任务的方法。而且,这些模型大都只专注于单一任务。但是,大语言模型具备了通过文本提示解决多种问题的能力,这种在上下文中的学习能力使得原本复杂的问题解决方式转变为自然语言的形式!
May 2, 2024
View Article搜索技术是计算机科学中极具挑战性的领域之一,仅有少数产品如 Google、Amazon 和 Instagram 能够做到出色。直至不久前,大多数产品并不依赖高效的搜索功能——它并非用户体验的关键部分。然而,随着大语言模型及其检索系统的迅猛发展,每个大语言模型公司都迫切需要将顶尖的搜索功能融入产品中,以确保其正常运作。面对这种新兴的需求,新一代 AI 公司将如何解决搜索问题?检索功能是大语言模型系统不可或缺的组成部分,这一点未来也不会改变。
May 2, 2024
View ArticlePerplexity 的联合创始人兼产品负责人 Johnny Ho 分享了他如何借助 AI 技术领导团队,如同指挥黏菌一般,构建他们的 AI 公司,以及更多前沿策略
May 2, 2024
View Article最近,Hugging Face 的 *Leaderboards and Evals* 研究团队进行了一系列小实验,揭示了评估结果对提示格式微小变化的极高敏感性。对于特定任务,即使是很小的提示变动也会导致结果大不相同,这并非我们所希望看到的:相同信息输入的模型,其输出应保持一致性。我们与 *Dottxt* 的合作伙伴探讨了这一问题,他们提出了一个新思路:是否有办法提升不同提示格式之间的一致性?现在,让我们来详细探讨这一点。
May 1, 2024
View Article这就是 Rabbit R1,它是一个装在盒子里的 AI,可以说是时代的象征。这个设备和 Humane AI Pin 有许多相似之处,不论是好是坏。不过,它也有两个所谓的独特之处,这些特点使它与 Humane AI Pin 区别开来。不管怎样,我们需要讨论一下这个问题。如果你觉得听起来熟悉,随时打断我,看看这个。
April 30, 2024
View Article这个视频主要介绍和点评了一款名为 Rabbit R1 的人工智能硬件助手。作者认为,作为一款售价 200 美元的消费级产品,R1 在设计和功能上还存在诸多不足之处,如滚轮交互体验欠佳、屏幕和音频表现一般、电池续航短等。同时,作者质疑 R1 这类 AI 硬件助手的实用价值,认为类似功能完全可以通过手机上的软件应用来实现。展望未来,作者预测一旦科技巨头们在自家移动操作系统中原生集成类似的 AI 助手功能,第三方的 AI 硬件设备将難以与之竞争。作者呼吁,硬件厂商在发布产品前应该给予评测者和消费者足够的时间去全面体验,不要盲目追赶所谓的"发布窗口期"。与其囿于硬件形态,不如把更多精力投入到底层 AI 技术的研发中来。
April 29, 2024
View Article今天我们要学习如何使用关键指标评估 RAG。
April 29, 2024
View Article如今,AI 是一项伟大的科技,因为 AI 将解决我们现在面临的所有问题。它能解决就业问题,能治疗疾病,能消除贫困,但同时它也会带来新的问题。假新闻将会愈演愈烈,网络攻击将变得更加严重,我们将面临全自动的 AI 武器的问题。我认为 AI 有潜力创造出无比稳定的独裁统治。
April 28, 2024
View Article嗨,亲爱的听众们。欢迎收听"No Priors"的另一期节目。今天,我们有幸与 OpenAI 的 Sora 团队进行交谈,Sora 是一种新的生成式视频模型,能够接受一段文本提示词,然后返回一段视频剪辑高清、视觉连贯的,长达一分钟。Sora 也引起了人们的思考,即这些大规模的视频模型是否是世界模拟器,同时它把可扩展的 Transformer 架构应用到了视频领域。我们今天的嘉宾就是 Sora 的团队成员们。Aditya Ramesh、Tim Brooks 和 Bill Peebles。欢迎来到"No Priors",各位。
April 26, 2024
View Article2024 年 2 月,我们首次报道了 OpenAI 发布的 SORA,当时我们将其形容为视频领域的 DALL·E。SORA 是一个生成时间更长、内容更连贯的视频的扩散模型。OpenAI 通过使模型能预见多帧内容,成功解决了视频主体即便短暂消失也能保持连贯性的技术难题。目前,SORA 能够一次性生成长达一分钟的完整视频。OpenAI 还表示,未来可能进一步扩展视频的长度,甚至实现两段视频的无缝连接。
April 26, 2024
View Article工期延误以及台湾和美国同事之间的紧张关系正在困扰着这家芯片巨头在凤凰城的扩张。
April 25, 2024
View ArticleMeta 宣布推出 Llama 3 的介绍视频文稿,里面介绍了很多 Llama 3 的细节。
April 24, 2024
View Article从这篇文章讲述了 Pedro David Garcia Lopez 的转变故事,他在 38 岁高龄从卡车司机转职成为了一个 Ruby on Rails 开发者,挑战了业界对年龄的固有偏见完全是无稽之谈!Pedro 的经历在 LinkedIn 上激励了我。
April 23, 2024
View Article遇见阿拉温德,这位来自印度的创新者,他辞去 OpenAI 的工作,决心要挑战 Google - 和玛丽娜·莫吉尔科的深入对话。新一代搜索引擎将会是什么样?让我们和阿拉温德·斯利尼瓦斯一起发现,他从印度来到美国,带着 AI 的力量来革新在线搜索体验。
April 22, 2024
View Article使用 Ray, LlamaIndex, Ragas, MLFlow 和 MinIO 在 Kubernetes 上的分布式 RAG 实验蓝图
April 20, 2024
View Article这是@rlancemartin 最近在几个聚会上关于在长上下文 LLM 时代使用 RAG 的讲座。随着上下文窗口增至超过 100 万 Token,很多人质疑 RAG 是否已经过时。我们结合几个最新的项目成果来分析这个问题。我们讨论了长上下文 LLM 在事实推理和信息检索方
April 19, 2024
View Article今天,我们正在介绍 Meta Llama 3,我们最先进的开源大语言模型 (LLM) 的下一代。Llama 3 模型很快将在 AWS, Databricks, Google Cloud, Hugging Face, Kaggle, IBM WatsonX, Microsoft Azure, NVIDIA NIM, 和 Snowflake 上可用,并得到 AMD, AWS, Dell, Intel, NVIDIA, 和 Qualcomm 提供的硬件平台的支持。
April 18, 2024
View Article