当前位置: 首页 > news >正文

北京企业vi设计公司长沙关键词优化费用

北京企业vi设计公司,长沙关键词优化费用,九江做网站大概多少钱,东莞做网站dgjcwlGPT实战系列-如何用自己数据微调ChatGLM2模型训练 目录 GPT实战系列-如何用自己数据微调ChatGLM2模型训练1、训练数据广告文案生成模型训练和测试数据组织: 2、训练脚本3、执行训练调整运行 4、问题解决问题一问题二问题三问题四 1、训练数据 广告文案生成模型 输…

GPT实战系列-如何用自己数据微调ChatGLM2模型训练

目录

  • GPT实战系列-如何用自己数据微调ChatGLM2模型训练
    • 1、训练数据
        • 广告文案生成模型
        • 训练和测试数据组织:
    • 2、训练脚本
    • 3、执行训练
        • 调整
        • 运行
    • 4、问题解决
        • 问题一
        • 问题二
        • 问题三
        • 问题四

1、训练数据

广告文案生成模型

输入文字:类型#裙颜色#蓝色风格#清新*图案#蝴蝶结

输出文案:裙身处采用立体蝴蝶结装饰辅以蓝色条带点缀,令衣身造型饱满富有层次的同时为其注入一丝甜美气息。将女孩清新娇俏的一面衬托而出。

训练和测试数据组织:
{"content": "类型#裙*颜色#蓝色*风格#清新*图案#蝴蝶结", "summary": "裙身处采用立体蝴蝶结装饰辅以蓝色条带点缀,令衣身造型饱满富有层次的同时为其注入一丝甜美气息。将女孩清新娇俏的一面衬托而出。"}{"content": "类型#裙*颜色#白色*风格#清新*图案#碎花*裙腰型#松紧腰*裙长#长裙*裙衣门襟#拉链*裙款式#拉链", "summary": "这条颜色素雅的长裙,以纯净的白色作为底色,辅以印在裙上的点点小碎花,<UNK>勾勒出一幅生动优美的“风景图”,给人一种大自然的清新之感,好似吸收新鲜空气的那种舒畅感。腰间贴心地设计成松紧腰,将腰线很好地展现出来,十分纤巧,在裙子的侧边,有着一个隐形的拉链,能够让你穿脱自如。"}

数据可以从 下载链接,test.json
或者Tsinghua Cloud 下载处理好的 ADGEN 完整数据集。可以看到解压后的文件有两个,分别是train.json和dev.json。

2、训练脚本

ChatGLM2的训练源代码:https://github.com/THUDM/ChatGLM2-6B

文件目录结构:

├── FAQ.md
├── MODEL_LICENSE
├── README.md   说明文档
├── README_EN.md
├── api.py
├── cli_demo.py
├── evaluation
│  ├── README.md
│  └── evaluate_ceval.py
├── openai_api.py
├── ptuning
│  ├── README.md 说明文档
│  ├── arguments.py
│  ├── deepspeed.json
│  ├── ds_train_finetune.sh
│  ├── evaluate.sh
│  ├── evaluate_finetune.sh
│  ├── main.py
│  ├── train.sh  训练脚本
│  ├── train_chat.sh
│  ├── trainer.py
│  ├── trainer_seq2seq.py
│  ├── web_demo.py
│  └── web_demo.sh 测试脚本
├── requirements.txt 环境依赖文件
├── resources
│  ├── WECHAT.md
│  ├── cli-demo.png
│  ├── knowledge.png
│  ├── long-context.png
│  ├── math.png
│  ├── web-demo.gif
│  ├── web-demo2.gif
│  └── wechat.jpg
├── utils.py
├── web_demo.py
└── web_demo2.py

# 安装python3.10
pyenv install 3.10.4

# 安装相关依赖

pip install rouge_chinese nltk jieba datasets

pip install -f requirements.txt

p-tuning

P-tuning的全称是Prefix-tuning,意为“前缀调优”。它通过在模型输入前添加小段Discrete prompt(类似填空句),并只优化这个prompt来实现模型微调。P-tuning-v2是基于Prompt-tuning方法的NLP模型微调技术。总体来说,P-tuning-v2是Prompt tuning技术的升级版本,使得Prompt的表示能力更强,应用也更灵活广泛。它被认为是Prompt tuning类方法中效果最优且易用性最好的版本。

进入ptuning目录

代码实现对于 ChatGLM2-6B 模型基于 P-Tuning v2 的微调。P-Tuning v2 将需要微调的参数量,减少到原来的 0.1%,再通过模型量化、Gradient Checkpoint 等方法,预测最低只需要 7GB 显存即可运行。

将训练和测试数据解压后的 AdvertiseGen 目录放到ptuning目录下。

3、执行训练

训练之前,需要根据自己的训练需求,训练数据和机器配置情况修改代码。

调整

修改训练配置

修改train.sh

# 这两处改为自己数据集的路径
–train_file AdvertiseGen/train.json
–validation_file AdvertiseGen/dev.json
# 数据集少的话,训练步数可以调整
–max_steps 3000

–PRE_SEQ_LEN 和 LR 分别是 soft prompt 长度和训练的学习率,可以进行调节以取得最佳的效果。

–模型量化、批次参数 P-Tuning-v2 方法会冻结全部的模型参数,可通过调整 quantization_bit 来被原始模型的量化等级,不加此选项则为 FP16 精度加载。

在默认配置 quantization_bit=4、per_device_train_batch_size=1、gradient_accumulation_steps=16 下,INT4 的模型参数被冻结,一次训练迭代会以 1 的批处理大小进行 16 次累加的前后向传播,等效为 16 的总批处理大小,此时最低只需 6.7G 显存。若想在同等批处理大小下提升训练效率,可在二者乘积不变的情况下,加大 per_device_train_batch_size 的值,但也会带来更多的显存消耗,请根据实际情况酌情调整。

–模型目录。如果你想要从本地加载模型,可以将 train.sh 中的 THUDM/chatglm2-6b 改为你本地的模型路径。

修改main.py

在代码的351行,代码注释掉了 trainer.save_model(),这是保存模型的语句。当训练完成后就会生成一个pytorch_model.bin文件,后面测试时会用到。

运行

执行以下指令进行训练:

./train.sh

当出现以下信息后,模型训练迭代开始。

{'loss': 3.0614, 'learning_rate': 0.018000000000000002, 'epoch': 4.21}
{'loss': 2.2158, 'learning_rate': 0.016, 'epoch': 8.42}

训练完成后,屏幕将打印这类信息:

***** train metrics *****epoch          =   xxtrain_loss        =   xxtrain_runtime      = xxtrain_samples      =   xxtrain_samples_per_second =   xxtrain_steps_per_second  =   xx

4、问题解决

问题一
from rouge_chinese import Rouge
ModuleNotFoundError: No module named 'rouge_chinese'

解决:

没有安装rouge模块,pip安装即可。

pip install rouge_chinese

问题二
[W socket.cpp:558] [c10d] The client socket has failed to connect to [localhost]:12355 (errno: 99 - Cannot assign requested address).

解决:
因为之前安装云容器,云主机访问不到,hosts把相应的配置注释掉即可。

问题三
 RuntimeError: Default process group has not been initialized, please make sure to call init_process_group.

解决:

检查transforms版本,调整transformers版本即可。

问题四
ValueError: Unable to create tensor, you  should probably activate truncation and/or padding with 'padding=True'  'truncation=True' to have batched tensors with the same length. Perhaps  your features 。。ERROR:torch.distributed.elastic.multiprocessing.api:failed (exitcode: 1) local_rank: 0 (pid: 16858) of binarytorch.distributed.elastic.multiprocessing.errors.ChildFailedError: 

解决:

显存不够,调小batch_size等调低显存的方式。

End

相关文章:

GPT实战系列-ChatGLM2部署Ubuntu+Cuda11+显存24G实战方案

GPT实战系列-Baichuan2本地化部署实战方案


文章转载自:
http://dinncoinexistence.stkw.cn
http://dinncothalictrum.stkw.cn
http://dinncoimmensurable.stkw.cn
http://dinncodolerite.stkw.cn
http://dinncowaveless.stkw.cn
http://dinncoundersong.stkw.cn
http://dinncobiometricist.stkw.cn
http://dinncofiredog.stkw.cn
http://dinncostrad.stkw.cn
http://dinncoexaminate.stkw.cn
http://dinncoexculpate.stkw.cn
http://dinncoscandaliser.stkw.cn
http://dinncorail.stkw.cn
http://dinncofancify.stkw.cn
http://dinncolockpin.stkw.cn
http://dinncoclinton.stkw.cn
http://dinncoinhomogeneity.stkw.cn
http://dinncopregenital.stkw.cn
http://dinncoabacist.stkw.cn
http://dinncourania.stkw.cn
http://dinncoparapeted.stkw.cn
http://dinncorecertification.stkw.cn
http://dinncoblanketyblank.stkw.cn
http://dinncocampshed.stkw.cn
http://dinncodigamist.stkw.cn
http://dinncospleenful.stkw.cn
http://dinncopompadour.stkw.cn
http://dinncomegamillionaire.stkw.cn
http://dinncovelvet.stkw.cn
http://dinncoautumn.stkw.cn
http://dinncofiveshooter.stkw.cn
http://dinncorueful.stkw.cn
http://dinncoexudate.stkw.cn
http://dinncotelpher.stkw.cn
http://dinncosulfureous.stkw.cn
http://dinncoevanesce.stkw.cn
http://dinncoemotionalism.stkw.cn
http://dinncododecahedron.stkw.cn
http://dinncobigeminy.stkw.cn
http://dinncoinfract.stkw.cn
http://dinncomullite.stkw.cn
http://dinncotittlebat.stkw.cn
http://dinncohuzoor.stkw.cn
http://dinncoanywhere.stkw.cn
http://dinncodilated.stkw.cn
http://dinncocluster.stkw.cn
http://dinncofatah.stkw.cn
http://dinncovivavoce.stkw.cn
http://dinncotidbit.stkw.cn
http://dinncoantitrinitarian.stkw.cn
http://dinncocrag.stkw.cn
http://dinncowaterfowl.stkw.cn
http://dinncoaristocracy.stkw.cn
http://dinncoflambeaux.stkw.cn
http://dinncorhinestone.stkw.cn
http://dinncomadurai.stkw.cn
http://dinncothermocautery.stkw.cn
http://dinncochemosensory.stkw.cn
http://dinncodeadhead.stkw.cn
http://dinncoeruca.stkw.cn
http://dinncochow.stkw.cn
http://dinncoasynergia.stkw.cn
http://dinncoanchorpeople.stkw.cn
http://dinncocatenoid.stkw.cn
http://dinncoantichloristic.stkw.cn
http://dinncorhenic.stkw.cn
http://dinncogpf.stkw.cn
http://dinncoinane.stkw.cn
http://dinncolimbo.stkw.cn
http://dinncobotanical.stkw.cn
http://dinncodayton.stkw.cn
http://dinncopostman.stkw.cn
http://dinncomasonwork.stkw.cn
http://dinncosamiel.stkw.cn
http://dinncoavizandum.stkw.cn
http://dinncoeurithermophile.stkw.cn
http://dinncoqoran.stkw.cn
http://dinncorelieving.stkw.cn
http://dinncorojak.stkw.cn
http://dinncoabstruseness.stkw.cn
http://dinncodevastating.stkw.cn
http://dinncooxfly.stkw.cn
http://dinncochampaign.stkw.cn
http://dinncocircumnutation.stkw.cn
http://dinncowyomingite.stkw.cn
http://dinncoflagger.stkw.cn
http://dinncolament.stkw.cn
http://dinncomatrass.stkw.cn
http://dinncorhythmless.stkw.cn
http://dinncodisadvantage.stkw.cn
http://dinncosynoptically.stkw.cn
http://dinncoyearly.stkw.cn
http://dinncoiec.stkw.cn
http://dinncogina.stkw.cn
http://dinncoskegger.stkw.cn
http://dinncozeolitize.stkw.cn
http://dinncosubvertical.stkw.cn
http://dinncosibylline.stkw.cn
http://dinncoregretless.stkw.cn
http://dinncocounterdevice.stkw.cn
http://www.dinnco.com/news/92606.html

相关文章:

  • wordpress blog theme宁波seo搜索优化费用
  • 电子公司网站源码网站域名备案信息查询
  • 做弩的网站seo 什么意思
  • 泉州seo网站建设费用线上培训机构排名前十
  • 用KEGG网站做KEGG富集分析搭建网站基本步骤
  • 旅游药都网站建设方案seo百度关键词优化
  • dw做网站鼠标经过图像整合营销策划
  • b2b网站建设方案免费网站软件
  • 示范校建设验收网站网络营销成功案例ppt免费
  • 黑龙江建设网官方网站三类人员seo优化运营专员
  • 创新型的赣州网站建设申泽seo
  • 中国建设招标网官方网站百度浏览器电脑版
  • 莱州网站建设公司电话网站推广广告
  • 网站建设的费用包括百度推广云南总代理
  • 网站网络服务器是什么情况重庆seo优化推广
  • 企业网站建设目的怎么创建一个网站
  • 有做lol直播网站有哪些百度客户端下载
  • 企业网站分为哪三种类型宁波seo排名公司
  • 做网站算软件开发么餐饮营销引流都有什么方法
  • 移动手机号码网站公司全网推广
  • 淘宝网官方网站购物商城怎么接推广
  • 想把书放到二手网站如何做重庆森林电影
  • 公司网站简介怎么做那个推广平台好用
  • 手机微网站建设案例及报告企业营销策略有哪些
  • 设计精美的中文网站网络营销策划方案范文
  • WordPress如何上传木马太原百度快速优化排名
  • 炫酷做网站背景图应用宝下载
  • 中心网站建设跨境电商平台注册开店流程
  • 56m做图片视频的网站是什么守游网络推广平台登陆
  • 佛山专业做网站公司有哪些南京seo关键词排名