当前位置:首页 > Time-R1 – 基于3B参数模型的时间推理语言模型
Time-R1 – 基于3B参数模型的时间推理语言模型
作者:AI下载 发布时间:2025-07-18

Time-R1是什么

Time-R1是伊利诺伊大学香槟分校研究团队开发的基于3B参数的语言模型,通过独特的三阶段强化学习训练方法,在时间推理能力上取得了显著突破。第一阶段“理解”,模型在时间戳推断、时间差估计等基础任务上建立基础;第二阶段“预测”,模型学习预测未来事件的具体时间;第三阶段“生成”,模型生成合理未来场景。模型采用动态奖励机制,逐步掌握复杂时间推理能力。Time-R1在时间推理任务中表现优异,如在时间戳推断任务中优于参数量大10倍的模型,在未来事件时间预测中取得最高分。

Time-R1的主要功能

基础时间观念建立:通过四大特训任务(时间戳推理、时间差计算、事件排序、时间实体补全)的强化微调,使模型能精准建立事件与时间的映射关系,构建起时间认知的基石。