在人工智能领域,麻省理工学院(MIT)和IBM公司始终处于前沿:他们不仅奠定了基础工作,创造了首批AI前身程序,还理论化机器"智能"可能如何实现。如今,八年前成立的MIT-IBM Watson AI Lab等合作机构,正在继续为明日AI技术的愿景提供专业知识支持。这对有望从中受益的行业和劳动力尤其重要:从预计全球经济效益3-4万亿美元,知识工作者和创造性任务80%的生产力提升,到未来三年内生成式AI融入业务流程(80%)和软件应用(70%)的显著整合。
学术与产业的创新桥梁
尽管过去一年工业界涌现出众多引人注目的AI模型,但学术界继续引领创新,贡献了大多数高被引研究。MIT-IBM Watson AI Lab的成功表现为54项专利披露、超过128,000次引用(h指数为162),以及50多个行业驱动的用例。实验室的众多成就包括使用AI成像技术改善支架放置、减少计算开销、在保持性能的同时缩小模型,以及硅酸盐化学的原子间势建模。
"实验室能够独特地确定需要解决的'正确'问题,这使我们与其他实体区别开来,"实验室MIT主任兼MIT Schwarzman计算学院战略产业合作主任Aude Oliva表示。"此外,我们的学生通过为企业AI挑战工作所获得的经验,转化为他们在就业市场的竞争力,并促进竞争性行业的发展。"
"MIT-IBM Watson AI Lab通过汇集IBM和MIT研究人员和学生之间的丰富合作,产生了巨大影响,"实验室MIT联合主席、电气工程与计算机科学系Vannevar Bush教授Anantha Chandrakasan说。"通过支持AI与其他许多学科交叉的跨学科研究,实验室正在推进基础工作,加速为我国和世界开发变革性解决方案。"
长期视角与短期应用的平衡
随着人工智能持续获得关注,许多组织难以将技术转化为有意义的结果。2024年Gartner研究发现,"到2025年底,至少30%的生成式AI项目将在概念验证后被放弃",这表明了对AI的雄心壮志和广泛需求,但缺乏如何开发和应用它以创造即时价值的知识。
在这里,实验室闪耀光芒,架起了研究与部署之间的桥梁。实验室当前研究组合的大部分都旨在为IBM、实验室企业成员或实际应用使用和开发新功能、能力或产品。其中包括大型语言模型、AI硬件和基础模型,包括多模态、生物医学和地理空间模型。在此过程中,以研究为导向的学生和实习生是无价的,他们提供热情和新视角,同时积累领域知识,帮助推导和推进该领域的工程进展,并利用AI作为工具开辟新的探索前沿。
2025年AAAI总统小组关于AI研究未来的报告发现支持了像实验室这样的学术产业合作在AI领域的必要性:"学术界在提供对工业界结果的独立建议和解释方面发挥作用。私营部门更关注短期,而大学和社会则更关注长期视角。"
将这些优势与开源和开放科学的推动结合起来,可以激发任何一方都无法实现的创新。历史表明,拥抱这些原则,共享代码并使研究可访问,对行业和社会都有长期益处。符合IBM和MIT的使命,实验室通过这种合作为公共领域贡献技术、发现、治理和标准,从而提高透明度,加速可复现性,确保可信的进展。
实验室的创建旨在结合MIT的深厚研究专长与IBM的工业研发能力,旨在在核心AI方法和硬件方面取得突破,以及在医疗保健、化学、金融、网络安全以及企业稳健规划和决策等新应用领域。
更小但更高效的AI模型
今天,大型基础模型正让位于更小、更特定任务的模型,这些模型能产生更好的性能。MIT电气工程与计算机科学系副教授Song Han和IBM Research的Chuang Gan等实验室成员的贡献使这成为可能,通过诸如once-for-all和AWQ等工作。此类创新通过更好的架构、算法缩小和激活感知权重量化提高效率,使语言处理等模型能够以更快的速度和更低的延迟在边缘设备上运行。
因此,基础、视觉、多模态和大型语言模型都从中受益,使Oliva、MIT EECS副教授Yoon Kim以及IBM Research成员Rameswar Panda、Yang Zhang和Rogerio Feris的实验室研究小组能够在此基础上开展工作。这包括为模型注入外部知识的技术,以及与最先进系统相比具有更高吞吐量的线性注意力变换器方法的发展。
视觉和多模态系统的理解和推理也看到了繁荣。像Task2Sim和AdaFuse这样的工作表明,如果在合成数据上进行预训练,视觉模型性能会得到提高,以及如何通过融合过去和当前特征图的通道来增强视频动作识别。
作为对精益AI的承诺的一部分,MIT EECS Sumitomo电气工业工程教授Gregory Wornell、IBM Research的Chuang Gan以及IBM Research基础AI副总裁兼实验室IBM主任David Cox的实验室团队已经证明,模型适应性和数据效率可以相辅相成。两种方法,EvoScale和Chain-of-Action-Thought推理(COAT),使语言模型能够通过改进先前的生成尝试,通过结构化迭代缩小范围,找到更好的响应,从而最大限度地利用有限的数据和计算。COAT使用元动作框架和强化学习通过自我纠正来解决推理密集型任务,而EvoScale将类似的哲学应用于代码生成,演化为高质量的候选解决方案。这些技术有助于实现资源意识强、有针对性、面向实际的部署。
"MIT-IBM研究对我们大型语言模型开发工作的影响怎么强调都不为过,"Cox说。"我们看到更小、更专业的模型和工具正在产生不成比例的影响,特别是当它们结合时。MIT-IBM Watson AI Lab的创新正在塑造这些技术方向,并通过watsonx等平台影响我们在市场上的战略。"
例如,实验室的众多项目为IBM的Granite Vision贡献了功能、能力和用途,尽管其体积紧凑,但它提供了令人印象深刻的计算机视觉,专为文档理解而设计。这正发生在企业对提取、解释和可信总结长格式中包含的信息和数据的需求不断增长之际。
跨学科AI研究的突破
2025年AAAI小组得出结论,超越直接AI研究并跨越学科的工作不仅有益,而且是推进技术和社会所必需的。
实验室的Caroline Uhler和Devavrat Shah——两者都是EECS和IDSS的Andrew(1956)和Erna Viterbi教授——以及IBM Research的Kristjan Greenewald的工作超越了专业领域。他们正在开发因果发现方法,以揭示干预如何影响结果,并确定哪些干预能实现预期结果。这些研究包括开发一个框架,既能阐明针对不同子群体的"治疗"可能如何展开,例如在电子商务平台上或对发病率结果实施移动限制。这一工作的发现可能影响从营销和医学到教育和风险管理的各个领域。
"AI和其他计算领域的进步正在影响人们如何制定和解决几乎所有学科的挑战,"MIT实验室联合主席、MIT Schwarzman计算学院院长、电气工程与计算机科学系Henry Ellis Warren(1894)教授Dan Huttenlocher说。"在MIT-IBM Watson AI Lab,研究人员认识到他们工作的这种跨学科性质及其影响,从多个角度质疑问题,并将行业中的实际问题带入,以开发新颖的解决方案。"
人才培养与未来展望
使这个研究生态系统蓬勃发展的一个重要因素是学生人才的稳定流入,他们通过MIT的本科生研究机会计划(UROP)、MIT EECS 6A计划以及新的MIT-IBM Watson AI Lab实习项目做出贡献。 altogether,超过70名年轻研究人员不仅加速了他们的技术技能发展,而且在实验室导师的指导和支持下,获得了AI领域的知识, themselves成为新兴的实践者。这就是为什么实验室不断寻求在探索AI潜力的各个阶段识别有前途的学生。
"为了释放AI的全部经济和社会潜力,我们需要培养'有用且高效的智能',"IBM Research AI副总裁兼实验室IBM主席Sriram Raghavan说。"将AI的承诺转化为进展,继续专注于创新以开发高效、优化且适合特定领域和用例的模型至关重要,这些模型可以轻松适应特定领域和用例。学术产业合作,如MIT-IBM Watson AI Lab,有助于推动实现这一可能的突破。"
随着AI技术的不断发展,MIT-IBM Watson AI Lab将继续扮演关键角色,通过其独特的学术-产业合作模式,推动AI技术向更加负责任、高效且符合社会需求的方向发展。实验室的研究不仅关注技术突破,还重视AI的社会影响和伦理考量,为构建真正有益于人类社会的AI系统奠定基础。









