DeepMind · 大模型

DeepMind 发布长程记忆新模型与数据集

DeepMind 发布了一项针对长程记忆能力的研究成果,同时推出了配套的模型与数据集。这项工作旨在提升大语言模型在处理超长上下文时的信息保持与检索能力,为需要持续记忆和推理的应用场景提供了新的技术路径。新模型在长序列任务上展现出显著改进,而公开的数据集则为后续研究建立了标准化的评估基准。

域名
deepmind.google
评分
5 · 重大发布
发布
2025-12-03

导读

这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。