阿里妈妈 URM:电商推荐系统的未来引擎
在浩瀚的算法世界中,推荐系统扮演着至关重要的角色,特别是在电商领域。阿里妈妈推出的 URM (Universal Recommendation Model),正是一款旨在革新电商推荐体验的世界知识大模型。它巧妙地融合了通用语言模型的知识与电商领域的专业知识,致力于解决传统模型在电商推荐场景中表现不佳的难题。URM 的出现,无疑为商家和消费者带来了双赢的局面。
URM:电商推荐的破局者
传统的推荐系统往往依赖于大量的历史数据,对于新商品或长尾商品,推荐效果往往不尽如人意。此外,用户兴趣的多样性和动态性也给推荐系统带来了挑战。URM 的出现,正是为了打破这些瓶颈。
URM 通过知识注入和信息对齐,将大型语言模型 (LLM) 的通用知识与电商领域的专业知识相结合,从而更好地理解商品和用户的需求。它引入了多模态融合的商品表征和高效的 Sequence-In-Set-Out 生成方式,能够同时处理多种推荐任务,如多场景推荐和长尾推荐等。更重要的是,URM 已经在阿里妈妈的展示广告场景中得到应用,显著提升了商家投放效果和消费者购物体验。
URM 的核心功能:多维度的推荐能力
URM 的强大之处在于其多方面的功能,这些功能共同构建了一个更加智能、高效和个性化的推荐系统:
- 多任务处理:URM 能够同时处理多种推荐任务,如多场景推荐、多目标推荐、长尾推荐和发现性推荐等。这意味着它可以根据不同的场景和目标,为用户提供更加精准的推荐结果。
- 用户兴趣理解:URM 能够全面理解用户的兴趣和需求,从而提供更符合用户当前情境的推荐结果。这得益于其强大的知识图谱和自然语言处理能力,能够从用户的历史行为和偏好中挖掘出深层次的需求。
- 高效率推荐:URM 能够在单次前向传播中生成高质量的推荐集合,满足工业级推荐系统的低时延、高 QPS 需求。这意味着用户可以更快地获得推荐结果,从而提升购物体验。
- 多模态融合:URM 结合商品的 ID 表征和语义表征(如文本、图像等),提升商品的表达能力和推荐的准确性。通过融合多种信息来源,URM 能够更全面地理解商品的特点和优势,从而为用户提供更相关的推荐。
- 零样本学习能力:URM 具备快速适应新任务和新场景的能力,在没有大量标注数据的情况下也能提供有效的推荐。这意味着 URM 可以更快地应用于新的商品和场景,从而为用户带来更多惊喜。
URM 的技术原理:深度解析
URM 的技术原理是其强大功能的基础。它主要包括多模态融合表征、Sequence-In-Set-Out 生成方式、任务定义与提示工程、训练方式和异步推理链路等几个方面:
多模态融合表征:URM 的多模态融合表征是其理解商品的关键。它结合了 ID 表征和语义表征,从而更全面地描述商品。
- ID 表征:基于分布式哈希表将商品 ID 映射为独特的嵌入向量,捕捉商品间的协同信息。这意味着 URM 可以通过商品 ID 来了解商品之间的关联性,从而为用户推荐更相关的商品。
- 语义表征:文本编码器和图像编码器将商品的文本描述和图像信息转换为语义嵌入向量。这使得 URM 能够理解商品的属性和特点,从而为用户提供更精准的推荐。
- 融合机制:MLP 层将 ID 表征和语义表征对齐融合,生成多模态商品嵌入向量,提升商品的表达能力。通过融合 ID 表征和语义表征,URM 可以更全面地理解商品,从而为用户提供更相关的推荐。
Sequence-In-Set-Out 生成方式:URM 采用高效的 Sequence-In-Set-Out 生成方式,能够快速生成高质量的推荐集合。
输入序列由用户行为中的商品 ID、任务提示中的文本 token 及特殊查询符(如 UM、LM)组成。输出机制基于用户建模头(hUM)和语言模型头(hLM)分别生成用户表征和文本输出。增加 UM token 数量,使 URM 在一次前向传播中并行生成多个用户表征,提升召回指标。
任务定义与提示工程:URM 通过文本来定义不同的推荐任务,并将商品 ID 作为特殊 token 注入文本描述,实现用户行为序列的高效表达。
设计不同的提示模板,调整推荐结果的分布,让模型根据不同的任务需求和用户行为动态调整推荐策略。这意味着 URM 可以根据不同的任务和用户行为,灵活地调整推荐策略,从而为用户提供更个性化的推荐。
训练方式:URM 结合商品推荐任务的噪声对比估计 (NCE) 损失和文本生成任务的负对数似然损失。
基于完整参数的有监督微调 (SFT),仅冻结商品的原始表征,保留 LLM 的预训练知识。这意味着 URM 可以在保留 LLM 的通用知识的同时,针对电商推荐任务进行优化,从而获得更好的推荐效果。
异步推理链路:为了满足低时延、高 QPS 要求,URM 设计了面向用户行为动态捕捉的异步推理链路,将推理结果持久化存储,供在线召回阶段读取。
基于多 instance 在同一容器部署,将 URM 推理的并发 qps 提升 200%。这意味着 URM 可以更快地响应用户的请求,从而提供更流畅的推荐体验。
URM 的应用场景:无限可能
URM 的应用场景非常广泛,几乎可以应用于所有需要推荐的电商场景:
- 多场景推荐:根据不同页面(如首页、详情页)提供个性化推荐。这意味着 URM 可以根据用户所处的页面,为其推荐更相关的商品。
- 多目标推荐:综合分析用户点击、购买等行为,预测兴趣商品。这意味着 URM 可以根据用户的行为,更准确地预测用户的兴趣,从而为其推荐更符合其需求的商品。
- 长尾商品推荐:挖掘低频商品的潜在价值,丰富用户选择。这意味着 URM 可以帮助用户发现更多有价值的商品,从而提升购物体验。
- 发现性推荐:推荐用户未曾接触但可能感兴趣的新品类商品。这意味着 URM 可以帮助用户发现更多新的商品,从而拓展用户的购物视野。
- 搜索增强推荐:结合查询意图和历史行为,提升搜索结果相关性。这意味着 URM 可以根据用户的搜索意图和历史行为,为用户提供更相关的搜索结果,从而提升搜索效率。
URM 的未来:无限潜力
URM 作为阿里妈妈推出的世界知识大模型,已经在电商推荐领域展现出强大的潜力。随着技术的不断发展,URM 将在未来发挥更大的作用。
可以预见,URM 将会不断进化,更好地理解用户需求,更精准地推荐商品,更高效地服务于电商行业。它将不仅仅是一个推荐系统,更是一个连接商家和消费者的桥梁,一个推动电商行业发展的引擎。
总结
阿里妈妈的 URM 大模型通过其独特的多模态融合表征、Sequence-In-Set-Out 生成方式以及任务定义与提示工程等技术,为电商推荐系统带来了革命性的改变。它不仅能够更全面地理解商品和用户的需求,还能够高效地生成高质量的推荐集合,从而为用户带来更个性化、更智能的购物体验。随着 URM 的不断发展和完善,我们有理由相信,它将在电商推荐领域发挥越来越重要的作用,引领电商行业走向更加智能化的未来。
arXiv技术论文:https://arxiv.org/pdf/2502.03041