源信息经过deepseek翻译并总结
摘要:
Kumo AI开发的关系型基础模型(RFM)是一种新型预训练AI,能将大语言模型的”零样本”能力应用于结构化数据库,预测传统LLM无法处理的未来事件。该技术通过自动将数据库转化为互联图谱,并泛化Transformer架构直接从图谱学习,取代了耗时的手动特征工程。RFM可作为AI代理的预测引擎,结合LLM处理非结构化数据的能力,提升企业决策效率。Kumo已发布公开演示版,并计划推出支持私有数据连接和微调的服务。
以下是翻译后的简体中文内容,已去除广告并保留原始格式和超链接:
Kumo的“关系型基础模型”能预测你的大语言模型看不到的未来
作者:Ben Dickson @BenDee983
2025年6月27日 12:40 PM
图片来源:VentureBeat与ChatGPT
编者注:Kumo AI是VB Transform大会年度创新展示的决赛入围者之一,并于周三在主舞台展示了RFM技术。
生成式AI的繁荣为我们提供了强大的语言模型,能够处理大量文本和其他类型的数据。但在预测客户流失或从结构化关系数据中检测欺诈等高价值预测任务上,企业仍停留在传统机器学习时代。
斯坦福大学教授兼Kumo AI联合创始人Jure Leskovec认为,这是当前AI领域的关键缺失。该公司开发的关系型基础模型(RFM)是一种新型预训练AI,将大语言模型(LLM)的“零样本”能力引入结构化数据库。
“这是关于预测未知的事物,预测尚未发生的情况,”Leskovec告诉VentureBeat,“这是一种全新的能力,我认为当前的生成式AI尚未涵盖。”
为什么预测性机器学习是“30年前的技术”
虽然LLM和检索增强生成(RAG)系统可以回答基于现有知识的问题,但它们本质上是回顾性的。企业仍需依赖经典机器学习来完成预测性任务。
例如,要构建一个预测客户流失的模型,企业需要雇佣数据科学团队花费大量时间进行“特征工程”,即从数据中手动创建预测信号。这一过程涉及复杂的数据整合,例如将客户的购买记录和网站点击记录合并为一个庞大的训练表。
“如果你想做机器学习(ML),抱歉,你仍停留在过去,”Leskovec说。昂贵且耗时的瓶颈阻碍了大多数组织充分利用数据的敏捷性。
Kumo如何为数据库通用化Transformer
Kumo的“关系型深度学习”方法通过两个关键见解跳过了这一手动过程:
- 它自动将任何关系数据库表示为一张互联的图。例如,用户表中的每一行成为用户节点,订单表中的每一行成为订单节点,并通过外键等关系连接,形成完整的数据图谱。
- Kumo将Transformer架构(LLM的核心)泛化为可直接从图谱中学习。Transformer通过“注意力机制”衡量序列中不同标记的重要性,而Kumo的RFM将同样的机制应用于图谱,使其能同时学习跨多张表的复杂模式。
Leskovec将这一飞跃比作计算机视觉的进化:早期ML工程师需手动设计边缘和形状等特征,而卷积神经网络(CNN)可直接从像素中学习。类似地,RFM直接读取原始数据库表,无需人工干预即可发现最具预测性的信号。
推动智能代理的未来
这项技术对AI代理的发展意义重大。要让代理在企业中执行有意义的任务,它不能仅处理语言,还需基于私有数据做出智能决策。RFM可作为这些代理的预测引擎。例如,客户服务代理可查询RFM以判断客户的流失概率或未来价值,并通过LLM定制对话内容。
“如果我们相信智能代理的未来,代理需要基于私有数据做出决策。而这就是实现的方式,”Leskovec解释道。
Kumo的工作预示了企业AI的两个互补方向:LLM处理非结构化文本的回顾性知识,RFM处理结构化数据的预测性任务。通过消除特征工程的瓶颈,RFM有望让更多企业快速低成本地从数据转向决策。
该公司已发布RFM的公开演示版,并计划在未来几周推出支持用户连接私有数据的版本。对于需要更高准确性的组织,Kumo还将提供针对私有数据集的微调服务。
---### 你所需的AI洞察力
提交
感谢订阅。查看更多 VB新闻通讯请点击此处。
发生错误。