Nouvelles et reportages
OPA-DPO:多模态大模型幻觉难题的高效解决方案
编者按:在视觉多模态大语言模型的快速发展中,幻觉问题一直是研究者们关注的焦点。模型生成与输入图像不一致甚至虚假的内容,不仅影响用户体验,也阻碍了多模态技术在实际场景中的落地。对此,微软亚洲研究院和香港中文大学的联合研究团队从直接偏好优化(DPO)入手,提出了 On-Policy Alignment (OPA)-DPO 算法,可通过确保训练数据与初始策略(reference policy)的一致性,…
端侧大模型部署新引擎:无需硬件修改,解锁商用DRAM的大模型推理
编者按:随着应用场景的扩展,端侧设备(如手机、电脑、可穿戴设备、机器人等)对大模型高效运行的需求日益增长,但端侧设备对模型运行的计算资源、访存带宽、能耗都有着极其苛刻的要求。存内计算技术有望从根本上解决以上资源问题,它能够将存储单元和计算单元融合,显著减少数据在存储和计算单元间频繁搬运而产生的资源损耗。然而,传统存内计算涉及对硬件架构的改动,不仅技术难度大,且迭代周期长,无法在实际场景中大规模量产…
编者按:在产业智能化加速发展的当下,时间序列数据已然成为智能决策系统的关键基石。然而,传统的时间序列生成模型往往难以应对跨领域、跨风格的数据需求,且生成的数据在实际应用中缺乏可控性和实用性。 为解决这些痛点,微软亚洲研究院推出开源框架 TimeCraft,融合多项研究成果,通过跨域泛化、自然语言控制与任务感知等创新技术,助力时间序列生成任务从结构理解到任务对齐的全流程能力建设。TimeCraft…
微软亚洲研究院新著问世:《无界——透视微软创新研究之境》
以人工智能大模型的崛起为标志,计算机科学踏入了一望无垠的未知之境。我们对技术变革带来的无限可能满怀期待,却也在颠覆性的重塑中遭遇诸多困惑与挑战: 新的研究范式已然到来,如何发现并投身于具有持久影响力的研究方向?面对无先例可循的技术“无人区”,突破性创新需要怎样的思维破壁?AI时代,需要什么样的人才?什么样的成长环境能够激发人才的潜能?企业如何构建持续创新的内生动力?前沿成果又该以何种方式、何种形态…
从直觉到“深度思考”:多维进化的大模型推理能力
编者按:尽管近年来人工智能的能力迅速增强,但在复杂的推理任务中仍存在不足。微软亚洲研究院的研究员们从多个角度对此展开研究,不断探索提升大模型推理能力的新途径。从利用蒙特卡洛树搜索模拟人类“深度思考”过程的 rStar-Math,到基于规则的强化学习方法 Logic-RL;从融合大语言模型数学直觉与符号方法的 LIPS,到提升自动形式化准确性的新框架;再到自动生成高质量、有监督数学数据的神经符号框架…
特征树驱动的数据合成框架,加速构建高质量模型基座
作者:工程与基础架构组 编者按:随着代码大模型能力的不断增强,高质量指令数据的构造成为释放其潜力的关键。然而,现有方法普遍依赖单一的代码片段作为构造种子,限制了数据的复杂度与多样性。近日,微软亚洲研究院联合厦门大学、清华大学提出全新特征树驱动的数据合成框架,通过建模代码语义层级关系,实现了对合成代码复杂度的精细控制,并支持从函数级到多文件级的多样任务生成。基于该框架训练得到的 EpiCoder 模…
微软亚洲研究院发布社会责任人工智能白皮书,助力构建以人为本的AI系统
编者按:在 AI 技术不断突破与快速落地的今天,如何确保其发展方向与人类价值观协调一致,正成为科技界与社会各界亟需回答的关键问题。近日,微软亚洲研究院发布了《社会责任人工智能:研究的挑战与机遇》白皮书,系统梳理了 AI 在社会实践中的复杂挑战,并提出了包括技术、伦理、治理等多维度的十大关键研究问题。通过跨越计算机科学与社会科学的深度对话,该白皮书深入探讨了如何设计“负责任的人工智能”,推动实现技术…
SYNTHLLM框架:突破人工智能“数据墙”瓶颈,为AI训练注入新动力
编者按:数据是人工智能发展的“动力燃油”,但如今其正面临“枯竭”的风险,这道“数据墙”成为制约大模型性能突破的关键瓶颈。在此背景下,合成数据技术应运而生。近期,微软亚洲研究院推出了一个可扩展的 SYNTHLLM 框架,能够生成多样化的合成数据,有效填补自然数据的空缺。此外,研究员们还发现并证实了合成数据的规模法则,为大模型使用合成数据进行训练与优化提供了科学依据。 人工智能在当今取得如此显著发展的…
祝贺微软亚洲研究院谢幸博士荣获“北京市劳动模范”称号!
在“五一”国际劳动节前夕,微软亚洲研究院全球研究合伙人谢幸博士凭借多年来在计算机领域的卓越成就与杰出贡献,荣获了北京市总工会颁发的“北京市劳动模范”称号。 近年来,谢幸博士领导的研究团队在社会计算与人工智能领域深耕细作,成果斐然,目前已发表数百篇论文,总引用超六万次。在此之前,谢幸博士开创性地开展了基于用户时空轨迹数据的研究,主导的 GeoLife 项目更是全球最早探索位置社交系统的研究之一。凭借…