当前位置: 首页 > news >正文

德文网站建设域名注册平台

德文网站建设,域名注册平台,近期的新新闻,网站和h5deepspeed存在一个bug,即在训练时不保存调度器状态,因此如果训练中断后再重新开始训练,调度器还是会从头开始而不是接着上一个checkpoint的调度器状态来训练。这个bug在deepspeed的github中也有其他人提出:https://github.com/mic…

deepspeed存在一个bug,即在训练时不保存调度器状态,因此如果训练中断后再重新开始训练,调度器还是会从头开始而不是接着上一个checkpoint的调度器状态来训练。这个bug在deepspeed的github中也有其他人提出:https://github.com/microsoft/DeepSpeed/issues/3875
因此我们需要写一个保存调度器状态的代码,才可以解决这个问题。
具体方法是加一个callback类,专门负责保存调度器的状态以及在训练重新开始时加载调度器的状态:
先在训练文件中给trainer加一个callback

from smoe.callbacks.save_model import SchedulerStateCallback
trainer.add_callback(SchedulerStateCallback)
class SchedulerStateCallback(TrainerCallback):def on_save(self, args: TrainingArguments, state: TrainerState, control: TrainerControl, **kwargs):if os.environ.get("RANK", "0") == "0":#scheduler = kwargs['lr_scheduler']scheduler = kwargs.get("lr_scheduler")if scheduler is None:return scheduler_state = scheduler.state_dict()#save_path = os.path.join(args.output_dir, SCHEDULER_NAME)# 使用 PREFIX_CHECKPOINT_DIR 和 global_step 创建检查点目录名checkpoint_folder = f"{PREFIX_CHECKPOINT_DIR}-{state.global_step}"# 完整的检查点目录路径checkpoint_path = os.path.join(args.output_dir, checkpoint_folder)# 如果目录不存在,则创建它if not os.path.exists(checkpoint_path):os.makedirs(checkpoint_path)# 完整的保存路径save_path = os.path.join(checkpoint_path, SCHEDULER_NAME)# 保存scheduler状态torch.save(scheduler_state, save_path)def on_train_begin(self, args: TrainingArguments, state: TrainerState, control: TrainerControl, **kwargs):# 如果resume_from_checkpoint设置了有效路径if args.resume_from_checkpoint is not None:load_path = os.path.join(args.resume_from_checkpoint, SCHEDULER_NAME)# 如果该路径下有保存的调度器状态,则加载它if os.path.exists(load_path):#scheduler = kwargs['lr_scheduler']scheduler = kwargs.get("lr_scheduler")if scheduler is None:return scheduler_state = torch.load(load_path)scheduler.load_state_dict(scheduler_state)

解决效果如下,我们可以看到,在chaeckpoint10重新开始训练的时候,学习率是接着之前的学习率开始的(5.5e-7),而不是从头开始(0.5e-7):
在这里插入图片描述在这里插入图片描述

http://www.dinnco.com/news/81143.html

相关文章:

  • 天河区网站制作朋友圈网络营销
  • 铜陵做网站成都网站seo报价
  • 那个网站可教做课件好seo服务加盟
  • 广东长海建设工程有限公司网站怎么做网页宣传
  • 电子商务网站建设试题3腾讯企业邮箱
  • 网站建设与推广seo优化便宜
  • 郑州网站推广效果掌门一对一辅导官网
  • 常用的建站工具有哪些看书网站排名
  • 网站设计建设平台网站推广公司推荐
  • 什么网站可以接单做设计百度seo优化推广公司
  • 政府网站设计理念网络营销的优势与不足
  • 太原做企业网站的广州seo
  • 闵行区做网站公司宁波seo哪家好快速推广
  • 网站后期维护费用百度免费官网入口
  • 网站建设问题新闻资讯营销最好的方法
  • 做文献综述用什么网站提高网站搜索排名
  • 无锡企业网站制作公司有哪些网站首页面设计
  • wordpress动态添加字段宁波营销型网站建设优化建站
  • 哪些网站可以做任务赚钱百度seo综合查询
  • 线上培训平台谷歌seo推广服务
  • 网站建设推荐网苏州关键词排名系统
  • 嘉兴公司做网站免费发布广告的网站
  • 龙华网站建设网站设计公司电脑软件推广平台
  • 夏津网站建设价格信息流广告文案
  • 如何建设社区网站网站关键词推广工具
  • 三、网站开发使用软件环境提交链接
  • 全网seo是什么意思合肥seo搜索优化
  • 济南个人网站建设成都网络营销搜索推广
  • 网站建设无锡海之睿关键词推广软件
  • 大连做网站哪家服务好seo教程有什么