阿里妈妈URM:电商推荐大模型如何重塑个性化购物体验?

0

在电商推荐系统中,如何才能更精准地理解用户需求,提供个性化的购物体验?阿里妈妈给出的答案是URM(Universal Recommendation Model),一款基于世界知识的大模型。URM的出现,旨在解决传统大语言模型(LLM)在电商推荐场景中表现不尽如人意的问题,它巧妙地融合了通用知识与电商领域的专业知识,为推荐系统带来了新的突破。

URM:电商推荐的革新者

URM的核心在于其知识注入和信息对齐机制。它不仅仅是一个通用的LLM,更是一个在电商领域深耕细作的专家。通过引入多模态融合的商品表征和高效的Sequence-In-Set-Out生成方式,URM能够胜任多种推荐任务,如多场景推荐、长尾推荐等,从而显著提升推荐效果。目前,URM已在阿里妈妈的展示广告场景中上线,为商家带来了更好的投放效果,也为消费者带来了更优质的购物体验。

那么,URM究竟有哪些独特的功能和技术原理呢?

URM的主要功能:

  1. 多任务处理: URM能够同时处理多种推荐任务,包括多场景推荐、多目标推荐、长尾推荐和发现性推荐等。这意味着URM可以根据不同的场景和目标,灵活地调整推荐策略,满足用户的多样化需求。

    多任务处理

  2. 用户兴趣理解: URM能够全面理解用户的兴趣和需求,从而提供更符合用户当前情境的推荐结果。它不仅仅关注用户的历史行为,还能够挖掘用户的潜在需求,为用户带来惊喜。

  3. 高效率推荐: URM能够在单次前向传播中生成高质量的推荐集合,满足工业级推荐系统对于低时延和高QPS(每秒查询率)的需求。这意味着URM可以在毫秒级的时间内,为用户生成个性化的推荐列表,保证用户体验的流畅性。

  4. 多模态融合: URM结合了商品的ID表征和语义表征(如文本、图像等),从而提升商品的表达能力和推荐的准确性。它能够从多个维度理解商品,为用户提供更全面的信息。

  5. 零样本学习能力: URM具备快速适应新任务和新场景的能力,即使在没有大量标注数据的情况下,也能够提供有效的推荐。这意味着URM可以快速应用于新的电商领域,为商家带来新的增长机会。

URM的技术原理:

URM之所以能够实现上述功能,离不开其独特的技术原理。下面,我们将深入探讨URM的技术细节:

  1. 多模态融合表征:

    • ID表征: URM基于分布式哈希表将商品ID映射为独特的嵌入向量,从而捕捉商品间的协同信息。这意味着URM可以发现具有相似属性的商品,为用户提供更多选择。
    • 语义表征: URM利用文本编码器和图像编码器将商品的文本描述和图像信息转换为语义嵌入向量。这意味着URM可以理解商品的含义和特征,为用户提供更精准的推荐。
    • 融合机制: URM使用MLP(多层感知机)层将ID表征和语义表征对齐融合,生成多模态商品嵌入向量,从而提升商品的表达能力。
  2. Sequence-In-Set-Out生成方式: URM的输入序列由用户行为中的商品ID、任务提示中的文本token及特殊查询符(如UM、LM)组成。输出机制基于用户建模头(hUM)和语言模型头(hLM)分别生成用户表征和文本输出。通过增加UM token数量,URM可以在一次前向传播中并行生成多个用户表征,从而提升召回指标。

    Sequence-In-Set-Out生成方式

    这种生成方式的优势在于,它能够充分利用用户的历史行为,同时结合任务提示,生成更符合用户需求的推荐结果。通过并行生成多个用户表征,URM可以更全面地理解用户,从而提升推荐的准确性。

  3. 任务定义与提示工程: URM基于文本来定义不同的推荐任务,并将商品ID作为特殊token注入文本描述,实现用户行为序列的高效表达。通过设计不同的提示模板,URM可以调整推荐结果的分布,让模型根据不同的任务需求和用户行为动态调整推荐策略。

    这种方法的灵活性在于,它可以通过简单的文本描述来定义不同的推荐任务,无需修改模型结构。通过调整提示模板,URM可以控制推荐结果的分布,从而满足不同的业务需求。

  4. 训练方式: URM结合了商品推荐任务的噪声对比估计(NCE)损失和文本生成任务的负对数似然损失。基于完整参数的有监督微调(SFT),URM仅冻结商品的原始表征,保留LLM的预训练知识。

    这种训练方式的优势在于,它可以在保留LLM的通用知识的同时,针对电商推荐任务进行优化。通过冻结商品的原始表征,URM可以避免过度拟合,提高模型的泛化能力。

  5. 异步推理链路: 为了满足低时延、高QPS的要求,URM设计了面向用户行为动态捕捉的异步推理链路,并将推理结果持久化存储,供在线召回阶段读取。通过基于多instance在同一容器部署,URM将推理的并发qps提升了200%。

    这种推理链路的优势在于,它可以在保证低时延的同时,处理大量的用户请求。通过异步推理和持久化存储,URM可以避免重复计算,提高系统的效率。

URM的应用场景:

URM的应用场景非常广泛,可以应用于电商平台的各个环节,为用户提供个性化的推荐服务。以下是一些典型的应用场景:

  1. 多场景推荐: URM可以根据用户所处的不同页面(如首页、详情页),提供个性化的推荐。例如,在首页,URM可以推荐用户可能感兴趣的热门商品;在详情页,URM可以推荐与当前商品相关的商品。
  2. 多目标推荐: URM可以综合分析用户的点击、购买等行为,预测用户感兴趣的商品。例如,URM可以根据用户的历史购买记录,推荐用户可能需要的商品;根据用户的点击行为,推荐用户可能感兴趣的商品。
  3. 长尾商品推荐: URM可以挖掘低频商品的潜在价值,丰富用户的选择。例如,URM可以推荐一些小众但优质的商品,满足用户的个性化需求。
  4. 发现性推荐: URM可以推荐用户未曾接触但可能感兴趣的新品类商品。例如,URM可以根据用户的兴趣爱好,推荐一些用户从未购买过的商品,为用户带来惊喜。
  5. 搜索增强推荐: URM可以结合查询意图和历史行为,提升搜索结果的相关性。例如,当用户搜索“连衣裙”时,URM可以根据用户的历史购买记录和浏览行为,推荐用户可能喜欢的连衣裙款式。

URM的未来展望:

URM作为阿里妈妈推出的世界知识大模型,为电商推荐系统带来了新的可能性。它通过融合通用知识与电商领域的专业知识,实现了更精准的用户需求理解和个性化推荐。随着技术的不断发展,URM有望在未来发挥更大的作用,为商家带来更好的投放效果,也为消费者带来更优质的购物体验。

当然,URM也面临着一些挑战。例如,如何更好地处理冷启动问题,如何更好地保护用户隐私,这些都是URM需要解决的问题。但相信随着技术的不断进步,这些问题都将迎刃而解。

总而言之,URM是电商推荐系统的一次重要革新,它代表着未来的发展方向。我们期待URM能够在未来取得更大的成就,为电商行业带来更多的惊喜。