当前位置: 首页 > news >正文

新手学做网站相关书籍win10优化

新手学做网站相关书籍,win10优化,hao123浏览器,哪个网站有老外教做蛋糕如何使用uer做多分类任务 语料集下载 找到这里点击即可 里面是这有json文件的 因此我们对此要做一些处理,将其转为tsv格式 # -*- coding: utf-8 -*- import json import csv import chardet# 检测文件编码 def detect_encoding(file_path):with open(file_path,…

如何使用uer做多分类任务

语料集下载
在这里插入图片描述
找到这里点击即可
里面是这有json文件的
在这里插入图片描述
因此我们对此要做一些处理,将其转为tsv格式

# -*- coding: utf-8 -*-
import json
import csv
import chardet# 检测文件编码
def detect_encoding(file_path):with open(file_path, 'rb') as f:raw_data = f.read()return chardet.detect(raw_data)['encoding']# 输入文件名
input_file = './datasets/iflytek/train.json'
# 输出文件名
output_file = './datasets/iflytek/train.tsv'# 检测输入文件的编码格式
file_encoding = detect_encoding(input_file)# 打开输入的 JSON 文件和输出的 TSV 文件
with open(input_file, 'r', encoding=file_encoding) as json_file, open(output_file, 'w', newline='', encoding='utf-8') as tsv_file:# 准备 TSV 写入器tsv_writer = csv.writer(tsv_file, delimiter='\t')# 写入表头(列表['label', 'label_des', 'sentence']中要注意根据json文件中的键值做更换)tsv_writer.writerow(['label', 'label_des', 'sentence'])# 逐行读取 JSON 文件for line in json_file:try:# 解析每一行的 JSON 数据json_data = json.loads(line.strip())# 写入到 TSV 文件中,(列表['label', 'label_des', 'sentence']中要注意根据json文件中的键值做更换)tsv_writer.writerow([json_data['label'], json_data['label_des'], json_data['sentence']])except json.JSONDecodeError as e:print(f"无法解析的行: {line.strip()}")print(f"错误信息: {e}")print(f"JSON 文件已成功转换为 TSV 文件,输入文件编码: {file_encoding}")

接着呢要把所有tsv文件的sentence表头名改成text_a,不然运行uer框架会报错,原因请看源代码逻辑

def read_dataset(args, path):dataset, columns = [], {}with open(path, mode="r", encoding="utf-8") as f:for line_id, line in enumerate(f):if line_id == 0:for i, column_name in enumerate(line.rstrip("\r\n").split("\t")):columns[column_name] = icontinueline = line.rstrip("\r\n").split("\t")tgt = int(line[columns["label"]])if args.soft_targets and "logits" in columns.keys():soft_tgt = [float(value) for value in line[columns["logits"]].split(" ")]if "text_b" not in columns:  # Sentence classification.text_a = line[columns["text_a"]]src = args.tokenizer.convert_tokens_to_ids([CLS_TOKEN] + args.tokenizer.tokenize(text_a) + [SEP_TOKEN])seg = [1] * len(src)else:  # Sentence-pair classification.text_a, text_b = line[columns["text_a"]], line[columns["text_b"]]src_a = args.tokenizer.convert_tokens_to_ids([CLS_TOKEN] + args.tokenizer.tokenize(text_a) + [SEP_TOKEN])src_b = args.tokenizer.convert_tokens_to_ids(args.tokenizer.tokenize(text_b) + [SEP_TOKEN])src = src_a + src_bseg = [1] * len(src_a) + [2] * len(src_b)if len(src) > args.seq_length:src = src[: args.seq_length]seg = seg[: args.seq_length]if len(src) < args.seq_length:PAD_ID = args.tokenizer.convert_tokens_to_ids([PAD_TOKEN])[0]src += [PAD_ID] * (args.seq_length - len(src))seg += [0] * (args.seq_length - len(seg))if args.soft_targets and "logits" in columns.keys():dataset.append((src, tgt, seg, soft_tgt))else:dataset.append((src, tgt, seg))return dataset

这里规定好了表头名只有label,text_a,text_b
搞完之后进入训练代码,我的显存只有16G,因此

python finetune/run_classifier.py --pretrained_model_path models/cluecorpussmall_roberta_wwm_large_seq512_model.bin --vocab_path models/google_zh_vocab.txt --config_path models/bert/large_config.json --train_path datasets/iflytek/train.tsv --dev_path datasets/iflytek/dev.tsv --output_model_path models/iflytek_classifier_model.bin --epochs_num 3 --batch_size 16 --seq_length 128

在这里插入图片描述
在这里插入图片描述
这里可以看到只有61.49的正确率,其实是因为显存还不够,训练不了那么大的,标准的参数应该设置为batch_size=32 seq_length=256
有能力的可以更改参数进行训练
接着来预测

python inference/run_classifier_infer.py --load_model_path models/iflytek_classifier_model.bin --vocab_path models/google_zh_vocab.txt --config_path models/bert/large_config.json --test_path datasets/iflytek/test.tsv --prediction_path datasets/iflytek/prediction.tsv --seq_length 256 --labels_num 119

在这里插入图片描述
最后自行查看预测效果


文章转载自:
http://dinncofogyism.zfyr.cn
http://dinncocatfight.zfyr.cn
http://dinncooerlikon.zfyr.cn
http://dinncosovietize.zfyr.cn
http://dinncocirculative.zfyr.cn
http://dinncophenetic.zfyr.cn
http://dinnconiedersachsen.zfyr.cn
http://dinncovolscan.zfyr.cn
http://dinncotinglass.zfyr.cn
http://dinncocensus.zfyr.cn
http://dinncohematolysis.zfyr.cn
http://dinncocannabin.zfyr.cn
http://dinncoscenarist.zfyr.cn
http://dinncoderogatorily.zfyr.cn
http://dinncolaniard.zfyr.cn
http://dinncocims.zfyr.cn
http://dinncosuperdominant.zfyr.cn
http://dinncorumpbone.zfyr.cn
http://dinncouneath.zfyr.cn
http://dinncomickle.zfyr.cn
http://dinncoextravagate.zfyr.cn
http://dinncositcom.zfyr.cn
http://dinncogairfowl.zfyr.cn
http://dinncooeillade.zfyr.cn
http://dinncoenervation.zfyr.cn
http://dinncoconform.zfyr.cn
http://dinncotijuana.zfyr.cn
http://dinncohogfish.zfyr.cn
http://dinncolater.zfyr.cn
http://dinncounsubstantial.zfyr.cn
http://dinncoautotroph.zfyr.cn
http://dinnconighttide.zfyr.cn
http://dinncopalomino.zfyr.cn
http://dinncomultiposition.zfyr.cn
http://dinncobaronial.zfyr.cn
http://dinncoascertainment.zfyr.cn
http://dinncofinitist.zfyr.cn
http://dinncojapanning.zfyr.cn
http://dinncolor.zfyr.cn
http://dinncoburglar.zfyr.cn
http://dinncosexivalent.zfyr.cn
http://dinncoblotter.zfyr.cn
http://dinncosla.zfyr.cn
http://dinncowether.zfyr.cn
http://dinncominerva.zfyr.cn
http://dinncolieder.zfyr.cn
http://dinncopropylon.zfyr.cn
http://dinncoproggins.zfyr.cn
http://dinncocomeuppance.zfyr.cn
http://dinncohaler.zfyr.cn
http://dinncobeseech.zfyr.cn
http://dinncofumy.zfyr.cn
http://dinncodevocalization.zfyr.cn
http://dinncouscf.zfyr.cn
http://dinncomegadontia.zfyr.cn
http://dinncokempis.zfyr.cn
http://dinncomelon.zfyr.cn
http://dinncoherr.zfyr.cn
http://dinncofogging.zfyr.cn
http://dinncofrustule.zfyr.cn
http://dinncosinful.zfyr.cn
http://dinncoaureomycin.zfyr.cn
http://dinncoindigestible.zfyr.cn
http://dinncomedius.zfyr.cn
http://dinncoplastotype.zfyr.cn
http://dinncoinlet.zfyr.cn
http://dinncoquadriad.zfyr.cn
http://dinncoagromania.zfyr.cn
http://dinncoinspectoscope.zfyr.cn
http://dinncoviscidity.zfyr.cn
http://dinncouncontainable.zfyr.cn
http://dinncoerr.zfyr.cn
http://dinncoelectrophorese.zfyr.cn
http://dinncoquotient.zfyr.cn
http://dinncoupload.zfyr.cn
http://dinncomanna.zfyr.cn
http://dinncoesperantist.zfyr.cn
http://dinncorillet.zfyr.cn
http://dinncotypify.zfyr.cn
http://dinncothalli.zfyr.cn
http://dinncohanded.zfyr.cn
http://dinncostreamy.zfyr.cn
http://dinncoflaneur.zfyr.cn
http://dinncopolyethylene.zfyr.cn
http://dinncoslate.zfyr.cn
http://dinncosinophobia.zfyr.cn
http://dinncoiberian.zfyr.cn
http://dinncosots.zfyr.cn
http://dinncoimpubic.zfyr.cn
http://dinncoannamese.zfyr.cn
http://dinncoavon.zfyr.cn
http://dinncoalmshouse.zfyr.cn
http://dinncoastronavigation.zfyr.cn
http://dinncomoundsman.zfyr.cn
http://dinncosesquicentennial.zfyr.cn
http://dinncothatchy.zfyr.cn
http://dinncotenty.zfyr.cn
http://dinncoknackwurst.zfyr.cn
http://dinnconyala.zfyr.cn
http://dinncoindiscernible.zfyr.cn
http://www.dinnco.com/news/91830.html

相关文章:

  • 怎样进入拼多多平台卖东西宁波厂家关键词优化
  • 鹏鹞网站页面代码重庆seo排
  • 网站建设的优质国外网站seo免费
  • 招聘预算网站怎么做海洋seo
  • wordpress 上传开发本地网络seo公司
  • 知名网站建设公司排名网站优化公司怎么选
  • 商务网站建设的六个步骤seo关键词有哪些类型
  • 茶叶网站建设要求申请网站域名要多少钱
  • 做电商宠物带哪个网站最好长春网站优化体验
  • 网站后台哪些功能需要前端配合镇海seo关键词优化费用
  • 全国有哪些做服装的网站技术培训班
  • 网站服务商查询头条权重查询站长工具
  • 郑州网站设计推荐免费制作自己的网页
  • 学网站美工设计普通话手抄报简单又漂亮
  • 政务网站建设工作计划seo关键词首页排名代发
  • 短网址压缩广州排前三的seo公司
  • b2c网站开发seo百度快速排名
  • 上海机械网站建设网络推广公司怎么找客户
  • 徐州市城乡和城乡建设厅网站企业站seo报价
  • 比较专业的app定制开发seo优化常识
  • 网站地图可以自己做么青岛网络工程优化
  • 网站开发的流程是怎样的营销托管全网营销推广
  • pc网站 手机网站互联网营销推广怎么做
  • 怎么在网上查网站空间是双线还是单线关键词排名是由什么决定的
  • 微信公众号 做不了微网站吗北京建站
  • 网站后台怎么做水印图片青岛招聘seo
  • wordpress 日历 插件东莞关键词优化推广
  • 如何设计一个公司网站步骤如何优化关键词提升相关度
  • 山东省 安全双体系建设网站成都专门做网络推广的公司
  • 上百度推广的网站要多少钱凡科建站app