Microsoft旗下的Bing团队推出了名为“Harrier”的开源嵌入模型。该模型支持一百多种语言,拥有32000个令牌的上下文窗口,其训练数据涵盖超20亿个实例以及GPT-5生成的合成数据。据团队介绍,Harrier在多语言MTEB v2基准测试中表现领先,并且性能超过了OpenAI与亚马逊的专有模型。
除了完整的270亿参数模型外,团队还推出了两个更轻量的版本——0.6B和2.7亿参数模型,专门适配性能有限的硬件设备。这三款模型都能在MIT许可下于Hugging Face平台获取。后续,团队打算把这项技术整合到必应里,同时将其应用到全新的人工智能代理接地服务中。
嵌入模型承担着为人工智能系统搜索、检索并组织所需信息的职责,以此助力系统获取精准答案。正如微软所指出的,随着AI代理能够独立完成更复杂的多步骤任务,嵌入模型的作用正变得愈发关键。