MIT-IBM Watson AI Lab:塑造未来AI社会技术系统的创新力量
在人工智能领域,MIT和IBM始终处于前沿:他们奠定了基础工作,创造了首批AI前身程序,并理论化机器'智能'如何实现。如今,八年前成立的MIT-IBM Watson AI Lab等合作项目,正在继续为明日AI技术的承诺提供专业知识。这对工业和劳动力市场至关重要,特别是在短期内:从预测的3-4万亿美元全球经济收益,到知识工作者和创造性任务80%的生产力提升,再到未来三年内生成式AI融入业务流程(80%)和软件应用(70%)的重大整合。
虽然行业在过去一年中见证了显著模型的繁荣,但学术界继续驱动创新,贡献了大多数高被引研究。在MIT-IBM Watson AI Lab,成功表现为54项专利披露、超过12.8万次引用和h指数162,以及50多个行业驱动的用例。实验室的许多成就包括使用AI成像技术改进支架放置、降低计算开销、缩小模型同时保持性能,以及硅酸盐化学的原子间势建模。
学术与产业的完美结合
"实验室处于识别'正确'问题的独特位置,这使我们与其他实体区别开来,"实验室MIT主任兼MIT Schwarzman计算学院战略产业参与主任Aude Oliva表示。"此外,我们的学生从解决企业AI挑战中获得的经验,转化为他们在就业市场的竞争力,并促进竞争性行业的发展。"
"MIT-IBM Watson AI Lab通过汇集IBM和MIT研究人员和学生之间的丰富合作,产生了巨大影响,"实验室MIT联合主席、电气工程与计算机科学系Vannevar Bush教授Anantha Chandrakasan说。"通过支持AI与许多其他学科交叉的跨学科研究,实验室正在推进基础工作,加速为我们国家和世界开发变革性解决方案。"
长期视角的研究价值
随着AI持续获得关注,许多组织难以将技术转化为有意义的结果。2024年Gartner研究发现,"到2025年底,至少30%的生成式AI项目将在概念验证后被放弃",这表明了AI的雄心和广泛需求,但缺乏如何开发和应用它来创造即时价值的知识。
在这里,实验室闪耀光芒,弥合研究与部署之间的鸿沟。实验室当前年度研究投资组合的大部分都与IBM、实验室企业成员或实际应用的使用和开发新功能、能力或产品保持一致。这些包括大型语言模型、AI硬件和基础模型,包括多模态、生物医学和地理空间模型。以研究为导向的学生和实习生在这一追求中是无价的,他们提供热情和新视角,同时积累领域知识,帮助推导和推进该领域的工程进展,并利用AI作为工具开辟新的探索前沿。
2025年AAAI总统小组关于AI研究未来的报告发现支持了实验室在AI领域等学术产业合作贡献的必要性:"学术界在提供行业独立建议和结果解释及其后果方面发挥作用。私营部门更关注短期,而大学和社会则更关注长期视角。"
将这些优势与开源和开放科学的推动力结合起来,可以激发任何一方都无法实现的创新。历史表明,采用这些原则,共享代码并使研究可访问,对行业和社会都有长期好处。符合IBM和MIT的使命,实验室通过这种合作将技术、发现、治理和标准贡献给公共领域,从而提高透明度,加速可重复性,并确保可靠的进步。
实验室的创建是为了将MIT的深度研究专长与IBM的工业研发能力相结合,旨在在核心AI方法和硬件以及医疗保健、化学、金融、网络安全和稳健的业务规划与决策等新应用领域取得突破。
更小不一定更好
今天,大型基础模型正让位于更小、更专门化的模型,从而产生更好的性能。来自MIT电气工程与计算机科学系副教授Song Han和IBM Research的Chuang Gan等实验室成员的贡献使这成为可能,通过诸如once-for-all和AWQ等工作。这类创新通过更好的架构、算法缩小和激活感知权重量化提高了效率,使语言处理等模型能够在边缘设备上以更快的速度和更低的延迟运行。
因此,基础、视觉、多模态和大型语言模型都受益于这些进步,使Oliva、MIT EECS副教授Yoon Kim以及IBM Research成员Rameswar Panda、Yang Zhang和Rogerio Feris的实验室研究小组能够在此基础上构建工作。这包括为模型注入外部知识的技术,以及与最先进的系统相比,具有更高吞吐量的线性注意力变换器方法。
视觉和多模态系统的理解和推理也看到了繁荣。像Task2Sim和AdaFuse这样的工作表明,如果在合成数据上进行预训练,可以改善视觉模型性能,并且通过融合过去和当前特征图的通道可以提升视频动作识别。
作为对精简AI的承诺的一部分,Gregory Wornell(MIT EECS Sumitomo Electric Industries工程教授)、IBM Research的Chuang Gan以及IBM Research基础AI副总裁兼实验室IBM主任David Cox的实验室团队表明,模型适应性和数据效率可以相辅相成。两种方法,EvoScale和Chain-of-Action-Thought推理(COAT),通过结构化迭代改进先前的生成尝试,缩小到更好的响应,使语言模型能够最大限度地利用有限的数据和计算。COAT使用元动作框架和强化学习通过自我纠正解决密集推理任务,而EvoScale将类似的哲学应用于代码生成,演化高质量候选解决方案。这些技术有助于实现资源意识强、有针对性、面向实际世界的部署。
"MIT-IBM研究对我们大型语言模型开发工作的影响怎么强调都不为过,"Cox说。"我们看到更小、更专业的模型和工具正在产生不成比例的影响,特别是当它们结合时。MIT-IBM Watson AI Lab的创新帮助塑造了这些技术方向,并通过watsonx等平台影响了我们在市场中的策略。"
例如,许多实验室项目为IBM的Granite Vision贡献了功能、能力和用途,这是一种令人印象深刻的计算机视觉,专为文档理解而设计,尽管其尺寸紧凑。这发生在对提取、解释和企业用途长格式信息数据的可信摘要需求不断增长的时期。
跨学科研究的深远影响
2025年AAAI小组总结道,除了直接研究AI并跨越学科的其他成就不仅有益,而且对推进技术和提升社会至关重要。
实验室的Caroline Uhler和Devavrat Shah(EECS和IDSS的Andrew(1956)和Erna Viterbi教授)与IBM Research的Kristjan Greenewald的工作超越了专业领域。他们正在开发因果发现方法,以揭示干预如何影响结果,并确定哪些干预能实现期望的结果。这些研究包括开发一个框架,既可以阐明对不同子群体的'治疗'可能如何展开,例如在电子商务平台上或对发病率结果的移动限制。这项工作的发现可能影响从营销和医学到教育和风险管理等领域。
"AI和其他计算领域的进步正在影响人们如何制定和解决几乎所有学科中的挑战,"MIT实验室联合主席、MIT Schwarzman计算学院院长、电气工程与计算机科学系Henry Ellis Warren(1894)教授Dan Huttenlocher说。"在MIT-IBM Watson AI Lab,研究人员认识到他们工作的这种跨学科性质及其影响,从多个角度审视问题,并将来自行业的现实问题带入,以开发创新解决方案。"
人才培养:实验室生态系统的关键
使这个研究生态系统蓬勃发展的一个重要组成部分是学生人才的稳定流入,他们通过MIT的本科生研究机会计划(UROP)、MIT EECS 6A项目和新的MIT-IBM Watson AI Lab实习计划做出贡献。 altogether,超过70名年轻研究人员不仅加速了他们的技术技能发展,而且通过实验室导师的指导和支持,获得了AI领域的知识,成为新兴的实践者。这就是为什么实验室不断寻求在探索AI潜力的各个阶段识别有前途的学生。
"为了释放AI的全部经济和社会潜力,我们需要培养'有用且高效的智能',"IBM Research AI副总裁兼实验室IBM主席Sriram Raghavan说。"将AI承诺转化为进步,关键是继续关注创新,开发高效、优化和适合目的的模型,这些模型可以轻松适应特定领域和用例。学术产业合作,如MIT-IBM Watson AI Lab,帮助推动实现这一可能的突破。"
未来展望:AI社会技术系统的演进
MIT-IBM Watson AI Lab的成功模式为未来AI社会技术系统的发展提供了重要启示。随着AI技术的不断演进,这种产学研合作模式将成为推动技术创新和应用落地的关键力量。实验室在AI基础研究、行业应用和人才培养方面的平衡发展,为解决AI实施中的长期挑战提供了有效路径。
未来,随着AI技术的深入发展,社会技术系统的复杂性将不断增加。MIT-IBM Watson AI Lab将继续发挥其独特优势,通过跨学科合作,推动AI在医疗、金融、教育等关键领域的创新应用,同时关注AI伦理、隐私保护和可持续发展等社会议题,确保AI技术真正造福人类社会。









